本研究提出了MoonCast,旨在解决现有文本到语音合成系统在生成长时间、多发言者和自发对话中的局限性。MoonCast结合了长上下文语言模型和自发性脚本生成模块,能够合成自然的播客风格演讲,实验结果表明其在自发性和连贯性方面显著优于传统方法。
完成下面两步后,将自动完成登录并继续当前操作。