小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
通过学习长期运动嵌入实现高效运动学生成

本文探讨了通过学习长期运动嵌入来高效生成运动的技术。研究表明,利用大规模轨迹获得的运动嵌入,可以更有效地生成长时间的真实运动,以满足文本提示或空间指令的目标。通过压缩运动嵌入并训练条件流匹配模型,生成的运动分布优于现有视频模型和特定任务方法。

通过学习长期运动嵌入实现高效运动学生成

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-24T00:00:00Z

谷歌推出Veo 3.1 Lite视频模型,成本低于Veo 3.1 Fast,支持文本和图像转视频,提供灵活的画幅和分辨率。4月7日将降低Veo 3.1 Fast价格,以便更多开发者使用。

使用Veo 3.1 Lite构建,我们最具成本效益的视频生成模型

The Keyword
The Keyword · 2026-03-31T16:00:00Z
杀进全球榜TOP2!国产视频模型黑马刚刚出现了

国产视频模型SkyReels-V4近期在全球视频大模型排行榜中跃升至第二位,展现出强大的多模态生成能力,支持文本、图像、视频和音频的组合输入,实现精准控制和专业级视频修复,推动视频创作全流程一体化。

杀进全球榜TOP2!国产视频模型黑马刚刚出现了

量子位
量子位 · 2026-02-27T08:04:54Z
AI Gateway上的Kling视频模型

Kling 3.0视频模型已在AI Gateway上线,支持从文本和图像生成高质量视频,具备多场景叙事和音频生成等功能,适合专业用户,提供无代码实验平台。

AI Gateway上的Kling视频模型

Vercel News
Vercel News · 2026-02-19T13:00:00Z

DeepMind提出了“帧链”(CoF)概念,旨在赋予视频模型通用视觉理解能力。Veo 3模型通过简单提示生成视频,展现出感知、建模和操控能力,能够处理多种视觉任务。尽管在特定任务上不及专用模型,但其性能正在快速提升,未来有望成为机器视觉的“通用基础模型”。

DeepMind率先提出CoF:视频模型有自己的思维链

量子位
量子位 · 2025-09-28T03:47:25Z
这个AI生图神器首次发布视频模型:不卷分辨率,但网友直呼画面惊艳超预期|附提示词

Midjourney推出首个视频模型,用户可将图像转换为视频,支持手动和自动模式。视频保持超现实美学,但功能尚显粗糙,分辨率仅为480p,缺乏音效和时间轴编辑。未来将继续开发3D模型和实时系统,旨在构建完整的内容生产体系。

这个AI生图神器首次发布视频模型:不卷分辨率,但网友直呼画面惊艳超预期|附提示词

爱范儿
爱范儿 · 2025-06-19T03:46:11Z
Meta推出V-JEPA 2,一种用于物理推理的视频世界模型

Meta推出V-JEPA 2,这是一种新型视频世界模型,旨在提升机器对物理环境的理解和预测能力。该模型经过两阶段训练,首先自监督预训练超过一百万小时的视频,然后在62小时的机器人数据上微调。V-JEPA 2在机器人操作任务中表现优异,成功率达65%至80%。

Meta推出V-JEPA 2,一种用于物理推理的视频世界模型

InfoQ
InfoQ · 2025-06-13T18:20:00Z

文章探讨了语言模型(LLM)与视频模型在学习能力上的差异。尽管视频数据更丰富,LLM却通过简单算法展现出更复杂的认知能力。作者将AI比作“柏拉图洞穴”,指出AI只能模仿人类知识,无法自主探索。未来的目标是让AI能够直接与物理世界互动,突破对人类知识的依赖。

不是视频模型“学习”慢,而是LLM走捷径|18万引大牛Sergey Levine

量子位
量子位 · 2025-06-10T09:15:50Z
Runway表示其最新的AI视频模型能够生成一致的场景和人物

AI初创公司Runway推出了Gen-4视频模型,能够在多个镜头中生成一致的场景和人物。该模型允许用户通过单一参考图像生成角色和物体,提供更好的故事连贯性和控制力。用户只需描述构图,模型便能从多个角度生成一致的输出。

Runway表示其最新的AI视频模型能够生成一致的场景和人物

The Verge
The Verge · 2025-04-01T18:31:20Z
Luma AI 的 Ray2 视频模型现已在 Amazon Bedrock 中可用

Luma AI 的 Ray2 视频模型已在 Amazon Bedrock 上推出,能够通过文本生成高质量视频,支持多种应用场景,如内容创作和广告。用户可通过 API 轻松生成不同角度和风格的视频。

Luma AI 的 Ray2 视频模型现已在 Amazon Bedrock 中可用

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-01-24T08:24:38Z
拿下近3亿元融资后,爱诗上线新模型,AI视频生成速度杀入10秒大关

爱诗科技的PixVerse V3.5视频模型实现接近实时的生成速度,显著提升运动控制和画质,支持多种动画风格,降低影视制作门槛,提供流畅的内容创作体验。

拿下近3亿元融资后,爱诗上线新模型,AI视频生成速度杀入10秒大关

机器之心
机器之心 · 2024-12-30T05:08:26Z

腾讯的Fast-Hunyuan视频模型开源后,速度提升8倍,生成5秒视频仅需1分钟,步骤减少至6步,画面更逼真。该模型由加州大学团队开发,支持多种微调方式,未来将推出图像到视频生成功能。

腾讯版Sora开源后,被提速8倍!官方点赞并预告:下月上新图生视频

量子位
量子位 · 2024-12-19T13:52:24Z

本研究提出了InfiniCube,一种可扩展的动态3D驾驶场景生成方法。该方法利用3D表示和视频模型,解决了现有方法在规模和一致性方面的不足,能够生成高保真且可控的3D场景。

InfiniCube: Unbounded and Controllable Dynamic 3D Driving Scene Generation with World-Guided Video Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z
谷歌的新生成式AI视频模型现已上线

谷歌推出了新生成式AI视频模型Veo,目前处于私密预览阶段,允许企业将其应用于内容创作。Veo能够根据文本或图像提示生成高质量的1080p视频,并且风格多样。同时,谷歌还向所有Google Cloud客户提供更新的Imagen 3图像生成器。Veo和Imagen 3内置保护措施,防止生成有害内容,并嵌入数字水印以减少错误信息。与OpenAI的Sora相比,谷歌在市场上处于领先地位。

谷歌的新生成式AI视频模型现已上线

The Verge
The Verge · 2024-12-04T11:30:24Z

本研究提出了一种新方法,将大型视频模型与连续动作结合,解决了缺乏具身代理的问题。结果表明,该框架在无外部监督下能有效完成复杂任务,优于专家演示的行为克隆基线,具有重要应用潜力。

通过目标条件探索将视频模型与动作对接

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-11T00:00:00Z

本研究提出了一种新的视频模型MV-CC,旨在简化遥感图像变化描述中的特征提取,实验结果显示该模型性能优于其他先进方法。

MV-CC: 遥感变化描述的掩膜增强视频模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

字节版Sora推出Seaweed和PixelDance视频模型,支持文生和图生视频,时长可达10秒。PixelDance具备多主体交互和多镜头一致性,能在一句提示词内切换多个镜头。其论文入选CVPR 2024,提出基于潜在扩散模型的方法,通过图像和视频联合训练,保持高保真生成。团队在WebVid-10M数据集上训练,并扩展无水印视频数据集,提升生成效果。产品已在火山引擎测试。

字节版Sora火爆24小时,同名论文再次被热议

量子位
量子位 · 2024-09-25T05:43:45Z
ACM MM24 | 复旦提出首个基于扩散模型的视频非限制性对抗攻击框架,主流CNN和ViT架构都防不住它

复旦大学研究者提出了一种名为ReToMe-VA的新型面向视频模型的对抗攻击方法。该方法通过逐时间步对抗隐变量优化策略,实现生成对抗样本的空间不可感知性,并引入递归token合并策略,提升对抗视频的迁移性和时序一致性。实验结果显示,ReToMe-VA在多种视频模型上实现了高攻击成功率,并在对抗防御方法中保持较高的鲁棒性。

ACM MM24 | 复旦提出首个基于扩散模型的视频非限制性对抗攻击框架,主流CNN和ViT架构都防不住它

机器之心
机器之心 · 2024-08-27T08:45:18Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码