应用 ASV 进行语音识别:TTS 模型中 VC 和持续性预测改进的应用

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究通过优化后端分类器,运用无监督领域适应技术,提高自动说话人验证系统在逻辑和物理接近情境下的欺骗稳健性。针对重放音频攻击,相对改进率分别达到36.1%和5.3%。此外,还进行了攻击分析和高斯后端的集成分析。

🎯

关键要点

  • 研究旨在提高自动说话人验证系统的欺骗稳健性。
  • 优化后端分类器,基于概率线性判别分析。
  • 运用三种无监督领域适应技术进行优化。
  • 系统在逻辑和物理接近情境下的表现得到提升。
  • 针对重放音频攻击,真实和伪造情况的相对改进率分别为36.1%和5.3%。
  • 进行了攻击分析、数据构成研究和高斯后端的集成分析。
➡️

继续阅读