OpenAI的《Her》难产,是被什么困住了手脚?

💡 原文中文,约2200字,阅读约需6分钟。
📝

内容提要

OpenAI的“Her”在开发中面临困难。存在法律争议,以确保像斯嘉丽·约翰逊的“Her”这样的争议性声音不会重现。此外,还需要解决安全问题,例如防止其被用作欺诈工具。此外,还有技术挑战需要克服,例如需要稳定的网络、固定设备和固定的物理环境。文章还提到低延迟、多设备兼容性以及处理各种网络条件和嘈杂环境的重要性。OpenAI正在与实时通信(RTC)技术提供商合作,如LiveKit,以优化AI音视频对话体验。中国的国内AI公司也在开发自己的端到端多模态模型和实时AI音视频对话应用。文章最后提到,目前在中国一轮对话的延迟已减少到约1秒,通过进一步优化,实现流畅和及时的响应不是问题。

🎯

关键要点

  • OpenAI的《Her》面临法律争议,需确保语音音色不再出现争议性声音。
  • 存在安全问题,需防止AI被用作欺诈工具。
  • 技术挑战包括需要固定网络、设备和物理环境。
  • 低延迟和多设备兼容性对AI音视频对话体验至关重要。
  • OpenAI与RTC技术提供商LiveKit合作,优化AI音视频对话体验。
  • 国内AI公司也在开发端到端多模态模型和实时AI音视频对话应用。
  • 中国的对话延迟已减少到约1秒,进一步优化可实现流畅响应。
➡️

继续阅读