Enhancing Audio Quality in Speech Anonymization with Perception-Driven Loss
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究强调云端语音助手中语音匿名化的重要性,提出了一种基于人类听觉系统的感知驱动损失函数。使用该函数的VQVAE模型在自然性、可懂度和韵律上优于传统模型,同时保持说话者匿名性,并在多种数据集、语言和性别中表现良好。
🎯
关键要点
- 本研究强调云端语音助手中语音匿名化的重要性。
- 提出了一种基于人类听觉系统的感知驱动损失函数。
- 使用该函数的VQVAE模型在自然性、可懂度和韵律上优于传统模型。
- 该模型能够保持说话者匿名性。
- 研究结果在多种数据集、语言和性别中表现良好。
➡️