💡
原文英文,约1000词,阅读约需4分钟。
📝
内容提要
DeepMind在Google I/O大会上展示了其名为Project Astra的通用助手的早期版本。Astra是一个实时的多模态AI助手,可以识别物体,回答问题和执行各种任务。它通过语音,文本,绘图,照片和视频进行工作。DeepMind还在研究其他模型,如Gemini 1.5 Flash,Veo和Gemini Nano。重点是创建能够代表用户完成任务的AI代理。DeepMind正在研究如何将多模态模型结合起来,并平衡大型通用模型与更小,更专注的模型。
🎯
关键要点
- DeepMind在Google I/O大会上展示了名为Project Astra的通用助手的早期版本。
- Astra是一个实时的多模态AI助手,可以识别物体,回答问题和执行各种任务。
- Astra通过语音、文本、绘图、照片和视频进行工作,展示了其强大的功能。
- DeepMind还推出了Gemini 1.5 Flash、Veo和Gemini Nano等新模型,重点在于提高速度和性能。
- Hassabis强调AI的未来将更多关注代理的能力,而不仅仅是模型本身。
- Astra的设计更接近于真正的实时AI助手,解决了速度和延迟问题。
- Google推出了Gemini Live,一个语音助手,允许用户与模型进行自然对话。
- Hassabis表示,未来的助手将涉及旅行规划等多种功能,仍在研究如何整合多模态模型。
❓
延伸问答
Project Astra是什么?
Project Astra是DeepMind展示的一个实时多模态AI助手,可以识别物体、回答问题并执行各种任务。
Astra如何与用户互动?
Astra通过语音、文本、绘图、照片和视频与用户互动,展示了其强大的多模态功能。
DeepMind还推出了哪些新模型?
DeepMind推出了Gemini 1.5 Flash、Veo和Gemini Nano等新模型,重点在于提高速度和性能。
Hassabis对AI助手的未来有什么看法?
Hassabis认为未来的AI助手将更多关注代理的能力,而不仅仅是模型本身。
Gemini Live是什么?
Gemini Live是一个语音助手,允许用户与模型进行自然对话,支持中断和回顾对话内容。
Astra在速度和延迟方面有什么改进?
Astra的设计解决了速度和延迟问题,使其更接近真正的实时AI助手。
➡️