小红花·文摘

DeepMind提出了“帧链”（CoF）概念，旨在赋予视频模型通用视觉理解能力。Veo 3模型通过简单提示生成视频，展现出感知、建模和操控能力，能够处理多种视觉任务。尽管在特定任务上不及专用模型，但其性能正在快速提升，未来有望成为机器视觉的“通用基础模型”。

DeepMind率先提出CoF：视频模型有自己的思维链

量子位 ·

在机器人领域，Sergey Levine提出了通用基础模型PI Zero，旨在简化机器人应用开发。通过开放源代码，研究团队希望推动机器人学习的进步，降低数据创建的门槛。PI Zero模型能够适应多种任务，强调高质量与多样化数据的重要性，以提升机器人的智能和适应能力。未来，团队计划进一步提升模型的指令理解和任务泛化能力。

π0：与Sergey Levine合作的机器人基础模型 - 719

Josherich的博客 ·