谷歌开发语音转换AI以恢复声音
原文英文,约600词,阅读约需2分钟。发表于: 。A team at Google Research developed a zero-shot voice transfer (VT) model that can be used to customize a text-to-speech (TTS) with a specific person's voice. This allows speakers who have lost...
谷歌研究团队开发了一种零样本语音转换模型,可以定制特定人声的文本转语音系统,特别适用于失声者如帕金森病或ALS患者。该模型支持多语言,只需几秒钟的参考语音即可复制声音。通过语音编码器生成嵌入向量,再传递给解码器。实验中,76%的评审认为生成语音与真实语音相同。为防止滥用,谷歌加入了音频水印。