OpenAI和谷歌分别发布重大更新

💡 原文中文,约1300字,阅读约需3分钟。
📝

内容提要

OpenAI发布了文本转视频模型Sora,谷歌发布了Gemini 1.5模型,具有更强的性能和长上下文理解能力。Gemini 1.5 Pro融入了重大架构更改,可以处理大量信息。

🎯

关键要点

  • OpenAI推出了第一个文本转视频模型Sora,能够根据文本指令生成高保真视频。
  • Sora的结果表明,扩展视频生成模型是构建物理世界通用模拟器的有前途的途径。
  • 谷歌推出了Gemini 1.5模型,显著增强了性能,特别是在长上下文理解方面。
  • Gemini 1.5 Pro配备了128,000令牌的上下文窗口,能够处理大量信息。
  • Gemini 1.5 Pro实现了与1.0 Ultra相当的质量,同时使用更少的计算资源。
  • 谷歌的模型可以处理1小时的视频、11小时的音频、超过30,000行代码或700,000个单词的代码库。
  • OpenAI正在开发搜索引擎产品,导致股价下跌。
  • 谷歌在发布时的准确性和功能性受到质疑,存在过度宣传的风险。
➡️

继续阅读