研究者提出了基于合成3D数据进行训练的大型重建模型LRM-Zero,使用程序化3D数据集Zeroverse进行训练,能够实现高质量的稀疏视角3D重建。研究结果表明,LRM-Zero在重建真实世界对象方面具有高视觉质量,无需考虑物体语义。
该论文提出了一种音频驱动的说话角色视频编辑方法,通过声音到关键点模块和基于关键点的编辑模块来填补语音和面部动作之间的鸿沟,生成高视觉质量的高分辨率视频。
完成下面两步后,将自动完成登录并继续当前操作。