小红花·文摘

DeepMind提出了“帧链”（CoF）概念，旨在赋予视频模型通用视觉理解能力。Veo 3模型通过简单提示生成视频，展现出感知、建模和操控能力，能够处理多种视觉任务。尽管在特定任务上不及专用模型，但其性能正在快速提升，未来有望成为机器视觉的“通用基础模型”。