OpenAI将GPT-5级推理引入其语音模型

OpenAI将GPT-5级推理引入其语音模型

💡 原文英文,约700词,阅读约需3分钟。
📝

内容提要

OpenAI推出了三种新的语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。GPT-Realtime-2性能提升11%,支持更复杂的交互;GPT-Realtime-Translate专注于实时翻译,支持70种输入语言和13种输出语言;GPT-Realtime-Whisper是最新的流媒体转录模型,适用于多种语音AI应用场景,定价合理。

🎯

关键要点

  • OpenAI推出了三种新的语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。
  • GPT-Realtime-2性能提升11%,支持更复杂的交互,扩展了上下文窗口至128,000个标记。
  • GPT-Realtime-Translate专注于实时翻译,支持70种输入语言和13种输出语言。
  • GPT-Realtime-Whisper是最新的流媒体转录模型,定价为每分钟0.017美元。
  • OpenAI认为开发者使用语音AI的模式主要有三种:语音到行动、系统到语音和语音到语音。

延伸问答

OpenAI推出了哪些新的语音模型?

OpenAI推出了GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper三种新的语音模型。

GPT-Realtime-2相比于之前的版本有什么改进?

GPT-Realtime-2性能提升11%,并将上下文窗口扩展至128,000个标记,支持更复杂的交互。

GPT-Realtime-Translate支持多少种语言的实时翻译?

GPT-Realtime-Translate支持70种输入语言和13种输出语言的实时翻译。

GPT-Realtime-Whisper的定价是多少?

GPT-Realtime-Whisper的定价为每分钟0.017美元。

开发者如何使用这些语音AI模型?

开发者可以通过语音到行动、系统到语音和语音到语音三种模式使用这些语音AI模型。

GPT-Realtime-2的推理能力有什么特点?

GPT-Realtime-2具备GPT-5级推理能力,能够理解上下文并进行复杂的交互。

➡️

继续阅读