💡
原文英文,约700词,阅读约需3分钟。
📝
内容提要
OpenAI推出了三种新的语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。GPT-Realtime-2性能提升11%,支持更复杂的交互;GPT-Realtime-Translate专注于实时翻译,支持70种输入语言和13种输出语言;GPT-Realtime-Whisper是最新的流媒体转录模型,适用于多种语音AI应用场景,定价合理。
🎯
关键要点
- OpenAI推出了三种新的语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。
- GPT-Realtime-2性能提升11%,支持更复杂的交互,扩展了上下文窗口至128,000个标记。
- GPT-Realtime-Translate专注于实时翻译,支持70种输入语言和13种输出语言。
- GPT-Realtime-Whisper是最新的流媒体转录模型,定价为每分钟0.017美元。
- OpenAI认为开发者使用语音AI的模式主要有三种:语音到行动、系统到语音和语音到语音。
❓
延伸问答
OpenAI推出了哪些新的语音模型?
OpenAI推出了GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper三种新的语音模型。
GPT-Realtime-2相比于之前的版本有什么改进?
GPT-Realtime-2性能提升11%,并将上下文窗口扩展至128,000个标记,支持更复杂的交互。
GPT-Realtime-Translate支持多少种语言的实时翻译?
GPT-Realtime-Translate支持70种输入语言和13种输出语言的实时翻译。
GPT-Realtime-Whisper的定价是多少?
GPT-Realtime-Whisper的定价为每分钟0.017美元。
开发者如何使用这些语音AI模型?
开发者可以通过语音到行动、系统到语音和语音到语音三种模式使用这些语音AI模型。
GPT-Realtime-2的推理能力有什么特点?
GPT-Realtime-2具备GPT-5级推理能力,能够理解上下文并进行复杂的交互。
➡️