机器之心 ·

全网都在猜，这些视频是不是字节AI生成的：该跟动捕说再见了？

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

动作捕捉技术迎来变革，字节跳动推出的DreamActor-M1框架能够高质量生成一致的人体动画，表现出色，可能取代传统动捕技术。

🎯

关键要点

动作捕捉技术迎来革命，字节跳动推出DreamActor-M1框架。
DreamActor-M1能够高质量生成一致的人体动画，表现出色，可能取代传统动捕技术。
该框架基于扩散式Transformer（DiT），通过混合引导机制实现动画的精细化控制。
只需一张参考图像，DreamActor-M1就能模仿视频中的人物行为，生成高质量动画。
研究者设计了融合隐式面部特征、3D头部球体和3D身体骨架的混合控制信号。
采用逐步训练策略，提升模型的泛化能力，适应不同尺度和姿态的变化。
结合连续帧中的运动模式与视觉参考，增强复杂动作中的时间一致性。
DreamActor-M1在肖像、半身及全身动画生成任务中优于现有技术。
系统通过提取人体骨架和头部信息，将动作转化为数字表示。
面部表情通过单独的编码器处理，帮助模型保留人物外貌细节。
模型训练采用共享权重的双分支结构，通过对比生成的去噪视频潜变量与真实视频潜变量进行监督学习。
生成动画视频时，使用一张人物图片和一段动作视频即可实现人物动起来。
DreamActor-M1在五项关键指标上的定量对比实验中表现优异，保真性更好。
存在一些局限性，例如在某些视角下生成的嘴部动作可能无法跟上示例。

❓

延伸问答

DreamActor-M1框架的主要功能是什么？

DreamActor-M1框架能够高质量生成一致的人体动画，表现出色，可能取代传统动捕技术。

DreamActor-M1是基于什么技术开发的？

DreamActor-M1基于扩散式Transformer（DiT）技术。

使用DreamActor-M1生成动画需要什么输入？

只需一张参考图像和一段动作视频即可生成动画。

DreamActor-M1在生成动画时如何保证时间一致性？

通过结合连续帧中的运动模式与视觉参考，增强复杂动作中的时间一致性。

DreamActor-M1与传统动捕技术相比有什么优势？

DreamActor-M1在保真性和表现力上优于现有技术，能够更好地保留人物特征，减少变形和鬼影现象。

DreamActor-M1存在哪些局限性？

在某些视角下生成的嘴部动作可能无法跟上示例，存在一定局限性。

🏷️

继续阅读

首尔的目标：NVIDIA与韩国如何共同构建AI的未来
NVIDIA创始人兼首席执行官黄仁勋访问韩国，强调AI供应链的重要性，并指出韩国在机器人和物理AI领域的潜力。他认为韩国是AI和游戏的中心，未来将有更多投资机会。
是时候造一台 AI 时代的手机了｜AIDONE 第五期
在AI时代，手机成为AI应用的最佳终端。vivo与爱范儿将于6月10日在广州举办AIDONE第五期，讨论如何将AI更好地融入手机工作流，提升用户体验。参与...
三大AI大佬联名要求强制筛查DNA订单：超级病毒即将进入车库实验室
三位AI专家呼吁立法，要求强制筛查合成DNA订单，因AI技术降低了生物武器制造的门槛，邮购病毒已成为现实。合成DNA过程简单，已有案例显示危险技术被滥用，...
Endava如何围绕AI代理重新设计软件交付
Endava是一家全球技术服务公司，专注于利用AI解决复杂商业问题。公司重新设计工作流程，推动AI在软件交付和日常运营中的应用，提升效率。AI不仅被开发团...
AdaCodec：一种适用于 AI 生成视频的编解码器
上海研究提出AdaCodec编解码器，通过优化帧间信息存储，显著减少AI视频生成的资源消耗。该系统在保持性能的同时，视觉令牌使用量减少约86%，提高了视频...
粉笔科技的人大讲座事件的说明与致歉
粉笔网CEO张小龙在人民大学的讲座中因言辞不当引发争议。他提到AI对就业的影响，认为体制内工作机会减少，并建议学生利用AI工具提升竞争力。因现场反应冷淡，...