人工智能周刊第298期 - Gemini 2.0、亚马逊Nova、Sora、Llama 3.3

人工智能周刊第298期 - Gemini 2.0、亚马逊Nova、Sora、Llama 3.3

💡 原文英文,约2300词,阅读约需9分钟。
📝

内容提要

谷歌发布了升级版AI模型Gemini 2,具备更强的多模态能力,能够理解视频和音频。CEO皮查伊强调开发更具“代理性”的模型,以便为用户提供规划和行动支持。同时,亚马逊推出了Nova系列AI基础模型,涵盖文本、图像和视频处理。Meta的Llama 3.3模型在行业基准测试中表现优异。

🎯

关键要点

  • 谷歌发布了升级版AI模型Gemini 2,具备更强的多模态能力,能够理解视频和音频。
  • CEO皮查伊强调开发更具“代理性”的模型,以便为用户提供规划和行动支持。
  • 谷歌还推出了两个专门的AI代理,分别用于编码和数据科学,并展示了Project Mariner,一个能够进行网页导航的Chrome扩展。
  • 亚马逊推出了Nova系列AI基础模型,包括文本、图像和视频处理的多种模型。
  • Nova系列包括Nova Micro、Nova Lite和Nova Pro,未来还将推出Nova Premier和内容生成模型。
  • Meta推出了新的生成AI模型Llama 3.3,性能优于其前身Llama 3.1,且成本更低。
  • Llama模型在行业基准测试中表现优异,但Meta面临使用限制和合规挑战。
  • Waymo在洛杉矶推出自动驾驶叫车服务,并计划在2026年在迈阿密推出机器人出租车服务。
  • OpenAI与国防科技公司Anduril合作,标志着其在军事应用方面的立场转变。
  • OpenAI的新订阅服务ChatGPT Pro提供更高级的功能,目标用户为高需求用户。

延伸问答

Gemini 2的主要功能是什么?

Gemini 2具备更强的多模态能力,能够理解视频和音频,并与用户进行人机交互。

亚马逊的Nova系列模型有哪些特点?

Nova系列包括Nova Micro、Nova Lite和Nova Pro,支持文本、图像和视频处理,并计划推出更多复杂模型。

Meta的Llama 3.3模型与前一版本相比有什么优势?

Llama 3.3在行业基准测试中表现优异,且成本更低,性能超过Llama 3.1。

OpenAI的ChatGPT Pro订阅服务提供哪些功能?

ChatGPT Pro提供更高级的功能,包括访问o1推理模型,适合高需求用户。

Waymo在洛杉矶推出了什么服务?

Waymo在洛杉矶推出了自动驾驶叫车服务,计划在2026年扩展到迈阿密。

Sora的主要功能是什么?

Sora可以将文本提示转换为视频,并提供多种视频生成工具,如故事板和混合功能。

➡️

继续阅读