小红花·文摘 - 小红花技术领袖俱乐部

我和「二次元老公」约上会了！全球首个可以玩的实时交互模型，Xmax X2.0发布

量子位 ·

Gemini CLI 对接 Seedance MCP

Gemini CLI 对接 Seedance MCP

静觅 ·

Gemini CLI 对接 Seedance MCP

Gemini CLI 对接 Seedance MCP

静觅 ·

从高拟真到真可用，LongCat-Video-Avatar 1.5 正式开源

美团技术团队 ·

通过学习长期运动嵌入实现高效运动学生成

通过学习长期运动嵌入实现高效运动学生成

Apple Machine Learning Research ·

谷歌推出Veo 3.1 Lite视频模型，成本低于Veo 3.1 Fast，支持文本和图像转视频，提供灵活的画幅和分辨率。4月7日将降低Veo 3.1 Fast价格，以便更多开发者使用。

使用Veo 3.1 Lite构建，我们最具成本效益的视频生成模型

The Keyword ·

杀进全球榜TOP2！国产视频模型黑马刚刚出现了

杀进全球榜TOP2！国产视频模型黑马刚刚出现了

量子位 ·

AI Gateway上的Kling视频模型

AI Gateway上的Kling视频模型

Vercel News ·

DeepMind提出了“帧链”（CoF）概念，旨在赋予视频模型通用视觉理解能力。Veo 3模型通过简单提示生成视频，展现出感知、建模和操控能力，能够处理多种视觉任务。尽管在特定任务上不及专用模型，但其性能正在快速提升，未来有望成为机器视觉的“通用基础模型”。

DeepMind率先提出CoF：视频模型有自己的思维链

量子位 ·

这个AI生图神器首次发布视频模型：不卷分辨率，但网友直呼画面惊艳超预期|附提示词

这个AI生图神器首次发布视频模型：不卷分辨率，但网友直呼画面惊艳超预期|附提示词

爱范儿 ·

Meta推出V-JEPA 2，一种用于物理推理的视频世界模型

Meta推出V-JEPA 2，一种用于物理推理的视频世界模型

InfoQ ·

文章探讨了语言模型（LLM）与视频模型在学习能力上的差异。尽管视频数据更丰富，LLM却通过简单算法展现出更复杂的认知能力。作者将AI比作“柏拉图洞穴”，指出AI只能模仿人类知识，无法自主探索。未来的目标是让AI能够直接与物理世界互动，突破对人类知识的依赖。

不是视频模型“学习”慢，而是LLM走捷径｜18万引大牛Sergey Levine

量子位 ·

Runway表示其最新的AI视频模型能够生成一致的场景和人物

Runway表示其最新的AI视频模型能够生成一致的场景和人物

The Verge ·

Luma AI 的 Ray2 视频模型现已在 Amazon Bedrock 中可用

Luma AI 的 Ray2 视频模型现已在 Amazon Bedrock 中可用

亚马逊AWS官方博客 ·

拿下近3亿元融资后，爱诗上线新模型，AI视频生成速度杀入10秒大关

拿下近3亿元融资后，爱诗上线新模型，AI视频生成速度杀入10秒大关

机器之心 ·

腾讯的Fast-Hunyuan视频模型开源后，速度提升8倍，生成5秒视频仅需1分钟，步骤减少至6步，画面更逼真。该模型由加州大学团队开发，支持多种微调方式，未来将推出图像到视频生成功能。

腾讯版Sora开源后，被提速8倍！官方点赞并预告：下月上新图生视频

量子位 ·

本研究提出了InfiniCube，一种可扩展的动态3D驾驶场景生成方法。该方法利用3D表示和视频模型，解决了现有方法在规模和一致性方面的不足，能够生成高保真且可控的3D场景。

InfiniCube: Unbounded and Controllable Dynamic 3D Driving Scene Generation with World-Guided Video Models

BriefGPT - AI 论文速递 ·

谷歌的新生成式AI视频模型现已上线

谷歌的新生成式AI视频模型现已上线

The Verge ·

本研究提出了一种新方法，将大型视频模型与连续动作结合，解决了缺乏具身代理的问题。结果表明，该框架在无外部监督下能有效完成复杂任务，优于专家演示的行为克隆基线，具有重要应用潜力。

Connecting Video Models with Actions through Goal-Conditioned Exploration

BriefGPT - AI 论文速递 ·

本研究提出了一种新的视频模型MV-CC，旨在简化遥感图像变化描述中的特征提取，实验结果显示该模型性能优于其他先进方法。

MV-CC: 遥感变化描述的掩膜增强视频模型

BriefGPT - AI 论文速递 ·