研究团队提出了MoCha,一种基于语音和文本生成完整角色对话视频的方法,突破了传统技术的局限,支持多角色动态对话,具备高准确度的唇动同步和情绪控制,显著提升了自动化叙事视频生成的潜力。
完成下面两步后,将自动完成登录并继续当前操作。