老年人和病理性语音的匿名化:使用DDSP和示例查询的语音转换
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了当前语音匿名化方法无法保留老年人和病理性语音中的韵律及独特语音模式的问题,尤其在远程健康监测中尤为重要。我们提出了一种基于语音转换的创新方法(DDSP-QbE),通过可微分数字信号处理和示例查询,有效区分语言、韵律和领域表现。最终结果表明,DDSP-QbE在可懂度、韵律和领域保存方面显著优于现有的语音转换技术,保持了语音质量和说话者匿名性。
研究发现,从语音记录中提取的说话者嵌入有助于痴呆症检测,但存在隐私问题。新方法将痴呆症相关韵律特征与说话者嵌入分离,保护隐私且保持检测效果。实验表明,该方法在说话者识别F1得分为0.01%时,痴呆症检测F1得分为74%,对合成语音自然度无影响。