OpenAI发布了gpt-realtime,提升了语音处理能力,减少延迟并改善语音质量。新API支持图像输入和电话呼叫,增强了开发者工具。gpt-realtime能更自然地响应风格指令,支持多语言和非语言线索,准确率显著提高,企业合作伙伴正在测试这些功能。
OpenAI发布了实时API,支持远程MCP服务器、图像输入和SIP电话呼叫,提升了语音代理能力。新模型gpt-realtime在理解复杂指令和生成自然语音方面表现出色,并推出了两种新声音。API优化了可靠性和低延迟,适合生产环境。
完成下面两步后,将自动完成登录并继续当前操作。