Introducing gpt-realtime and Realtime API updates for production voice agents

Realtime API har nu släppts allmänt med nya funktioner som gör det möjligt för utvecklare att bygga pålitliga, produktionsklara röstagenter, inklusive stöd för fjärranslutna MCP-servrar, bildinmatningar och telefonsamtal via SIP. En ny, avancerad tal-till-tal-modell, gpt-realtime, har lanserats, vilken visar förbättringar i att följa komplexa instruktioner, använda verktyg med precision och producera mer naturligt och uttrycksfullt tal. gpt-realtime-modellen har tränats för att hantera verkliga uppgifter som kundsupport och personlig assistans, med förbättringar i ljudkvalitet, intelligens och instruktionsföljning, samt förmåga att tolka icke-verbala signaler och växla språk mitt i en mening. Två nya röster, Cedar och Marin, har introducerats exklusivt för Realtime API, och befintliga röster har också uppdaterats med förbättringar för mer naturligt tal. Säkerhets- och integritetsåtgärder har implementerats i Realtime API, inklusive klassificerare för skadligt innehåll och krav på att informera användare om AI-interaktion, samt en prissänkning för gpt-realtime-modellen.