小红花·文摘

全网都在猜，这些视频是不是字节AI生成的：该跟动捕说再见了？

机器之心 ·

字节跳动推出 OmniHuman-1：基于单一人体图像和运动信号生成人体视频的端到端多模态框架

实时互动网 ·

本文介绍了多种基于扩散模型的人体动画生成方法，如“Dancing Avatar”、“FaceTalk”、“DREAM-Talk”、“VLOGGER”、“AniPortrait”、“LoopAnimate”、“UniAnimate”和“CyberHost”。这些方法利用音频、文本和图像输入生成高质量动态视频，提升了面部表情、姿势多样性和时间一致性，展现了在视频编辑和个性化应用中的潜力。

Loopy：驯化音频驱动的人物头像与长期运动依赖

BriefGPT - AI 论文速递 ·

本文介绍了AvatarGen方法，该方法利用2D图像生成高保真度可控人体动画。通过结合3D高斯分布点技术，显著提高了训练和推理速度，并在多视角视频中实现高质量重建。此外，研究提出的新型流程有效解决了多视角方法在密切交互人群姿态估计中的困难，提升了鲁棒性和精度。实验结果表明，该方法在几何和外观重建上达到了先进水平。

CHASE：基于稀疏输入的3D一致性人类头像生成

BriefGPT - AI 论文速递 ·