扩散条件期望模型用于高效稳健的目标语音提取

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该文介绍了一种基于扩散模型的无监督语音增强方法,通过学习干净语音的先验分布,结合噪声模型进行后验采样,取得了有希望的结果。

🎯

关键要点

  • 条件评分驱动扩散模型在监督式语音增强领域取得了显著关注和最先进的性能。
  • 这些监督方法在泛化到未见条件时可能面临挑战。
  • 提出了一种无监督的语音增强方法,利用扩散模型的生成能力。
  • 训练阶段使用评分驱动扩散模型学习干净语音的先验分布。
  • 通过后验采样方法结合干净语音先验与噪声模型进行语音增强。
  • 噪声参数通过迭代的期望最大化方法与干净语音估计同时学习。
  • 这是第一个探索基于扩散的生成模型用于无监督语音增强的工作。
  • 与变分自编码器和基于扩散的监督方法相比,取得了有希望的结果。
  • 为未来的无监督语音增强研究开辟了新的方向。
➡️

继续阅读