VoiceCraft是一种先进的神经编解码语言模型,专注于语音编辑和零样本文本到语音任务,生成的语音几乎无法与原声区分。该模型在多种口音和背景噪音下表现优异,并使用高质量的数据集RealEdit进行评估。研究还探讨了零样本语音合成和对话系统的创新方法,以提高人机交互的自然度和个性化。
完成下面两步后,将自动完成登录并继续当前操作。