Enhancing Audio Quality in Speech Anonymization with Perception-Driven Loss

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究强调云端语音助手中语音匿名化的重要性,提出了一种基于人类听觉系统的感知驱动损失函数。使用该函数的VQVAE模型在自然性、可懂度和韵律上优于传统模型,同时保持说话者匿名性,并在多种数据集、语言和性别中表现良好。

🎯

关键要点

  • 本研究强调云端语音助手中语音匿名化的重要性。
  • 提出了一种基于人类听觉系统的感知驱动损失函数。
  • 使用该函数的VQVAE模型在自然性、可懂度和韵律上优于传统模型。
  • 该模型能够保持说话者匿名性。
  • 研究结果在多种数据集、语言和性别中表现良好。
➡️

继续阅读