小红花·文摘

本研究提出了CTEFM-VC框架，以解决零样本语音转换中的说话人相似性和自然度问题。实验结果显示，该系统在这两个方面分别超越现有方法18.5%和7.0%。

Zero-Shot Voice Conversion Based on Content-Aware Timbre Integration Modeling and Flow Matching

BriefGPT - AI 论文速递 ·

谷歌开发语音转换AI以恢复声音

InfoQ ·

SelfVC是一种训练策略，通过自我合成的示例来改进语音转换模型。适用于零样本语音转换、跨语言语音转换和可控语音合成任务。SelfVC在自然度、说话人相似度和可理解性方面取得了最先进的结果。

基于一致性模型的歌声转换

BriefGPT - AI 论文速递 ·

SelfVC是一种训练策略，通过自我合成的示例来改进语音转换模型。它适用于零样本语音转换、跨语言语音转换以及可控语音合成任务。SelfVC在自然度、说话人相似度和可理解性方面取得了最先进的结果。

SEF-VC：无说话人嵌入的零样本声音转换与交叉注意力

BriefGPT - AI 论文速递 ·

SelfVC是一种训练策略，使用自我监督学习和说话人验证模型生成的交织的语音表示来训练具有可控性的语音转换模型，并通过创建具有挑战性的自我合成示例来不断改进模型。该模型适用于零样本语音转换、跨语言语音转换以及具有音高和语速修改的可控语音合成任务。在自然度、说话人相似度和可理解性的评估指标上，SelfVC 在零样本语音转换方面取得了最先进的结果。

Diff-HierVC: 基于扩散的层次化语音转换技术，具备鲁棒的声调生成和掩蔽式先验用于零样本说话人自适应

BriefGPT - AI 论文速递 ·