The Verge ·

Project Astra：谷歌AI的未来

💡 原文英文，约1000词，阅读约需4分钟。

📝

内容提要

DeepMind在Google I/O大会上展示了其名为Project Astra的通用助手的早期版本。Astra是一个实时的多模态AI助手，可以识别物体，回答问题和执行各种任务。它通过语音，文本，绘图，照片和视频进行工作。DeepMind还在研究其他模型，如Gemini 1.5 Flash，Veo和Gemini Nano。重点是创建能够代表用户完成任务的AI代理。DeepMind正在研究如何将多模态模型结合起来，并平衡大型通用模型与更小，更专注的模型。

🎯

关键要点

DeepMind在Google I/O大会上展示了名为Project Astra的通用助手的早期版本。
Astra是一个实时的多模态AI助手，可以识别物体，回答问题和执行各种任务。
Astra通过语音、文本、绘图、照片和视频进行工作，展示了其强大的功能。
DeepMind还推出了Gemini 1.5 Flash、Veo和Gemini Nano等新模型，重点在于提高速度和性能。
Hassabis强调AI的未来将更多关注代理的能力，而不仅仅是模型本身。
Astra的设计更接近于真正的实时AI助手，解决了速度和延迟问题。
Google推出了Gemini Live，一个语音助手，允许用户与模型进行自然对话。
Hassabis表示，未来的助手将涉及旅行规划等多种功能，仍在研究如何整合多模态模型。

❓

延伸问答

Project Astra是什么？

Project Astra是DeepMind展示的一个实时多模态AI助手，可以识别物体、回答问题并执行各种任务。

Astra如何与用户互动？

Astra通过语音、文本、绘图、照片和视频与用户互动，展示了其强大的多模态功能。

DeepMind还推出了哪些新模型？

DeepMind推出了Gemini 1.5 Flash、Veo和Gemini Nano等新模型，重点在于提高速度和性能。

Hassabis对AI助手的未来有什么看法？

Hassabis认为未来的AI助手将更多关注代理的能力，而不仅仅是模型本身。

Gemini Live是什么？

Gemini Live是一个语音助手，允许用户与模型进行自然对话，支持中断和回顾对话内容。

Astra在速度和延迟方面有什么改进？

Astra的设计解决了速度和延迟问题，使其更接近真正的实时AI助手。

🏷️