研究团队提出了MoCha,一种基于语音和文本生成完整角色对话视频的方法,突破了传统技术的局限,支持多角色动态对话,具备高准确度的唇动同步和情绪控制,显著提升了自动化叙事视频生成的潜力。
该文章介绍了CharacterGLM模型,它是基于ChatGLM的一种生成基于角色对话的模型。通过配置属性和行为,可以自定义各种AI角色或社交代理。该模型在一致性、人类相似度和互动方面优于其他大型语言模型。作者将发布6B版本的CharacterGLM和部分训练数据,以促进进一步研究。
完成下面两步后,将自动完成登录并继续当前操作。