OpenAI推出三款新实时语音模型,其中GPT-Realtime-2在复杂语音交互中表现突出,并增强了Fair Housing合规性。OpenAI承认提供数据,但否认作弊。
OpenAI 发布了新的实时语音模型,包括 GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper。这些模型提升了语音助手的智能,能够进行复杂任务、实时翻译和音频转录。GPT-Realtime-2 具备更强的推理能力,支持多线程操作,使得语音交互更加自然,未来可能改变我们与数字世界的互动方式。
以色列初创公司Deepdub推出了Lightning 2.5实时语音模型,性能显著提升,适用于联络中心和AI代理。该模型吞吐量提高2.8倍,延迟低至200毫秒,优化了NVIDIA GPU环境,支持多语言对话和媒体本地化,保持语音自然和情感细腻。
完成下面两步后,将自动完成登录并继续当前操作。