小红花·文摘

字节AI和浙大合作研发的Loopy项目能通过图像和音频生成自然的视频，具有良好的生成效果和视觉一致性。Loopy由ReferenceNet、DenoisingNet、Apperance和Audio四部分构成，能处理各种场景和细节。此前还有类似的项目CyberHost，但CyberHost是一个音频驱动的人类动画模型。

字节AI版小李子一开口：黄风岭，八百里

量子位 ·

本文介绍了多种基于扩散模型的人体动画生成方法，如“Dancing Avatar”、“FaceTalk”、“DREAM-Talk”、“VLOGGER”、“AniPortrait”、“LoopAnimate”、“UniAnimate”和“CyberHost”。这些方法利用音频、文本和图像输入生成高质量动态视频，提升了面部表情、姿势多样性和时间一致性，展现了在视频编辑和个性化应用中的潜力。

Loopy：驯化音频驱动的人物头像与长期运动依赖

BriefGPT - AI 论文速递 ·