美团推出了开源的多人对话视频生成框架MultiTalk,利用L-RoPE技术解决多音频流与人物错位问题。该框架适用于影视制作和直播电商,能够生成自然的交互视频,提升AI在内容创作中的应用潜力。
美团推出了开源的多人对话视频生成框架MultiTalk,利用L-RoPE技术解决多音频流与人物错位问题。该框架支持音频流、图像和文本输入,生成自然互动视频,适用于影视制作和直播电商等场景。
Talk3D是一种音频驱动的说话头合成框架,通过预训练的3D感知生成先验模型,重建面部几何形状。实验证明该方法在生成逼真的面部几何形状方面表现出色,超越现有基准。
完成下面两步后,将自动完成登录并继续当前操作。