用于单通道应用的潜变量模型的光谱正则化框架

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种使用深度卷积神经网络作为结构变分近似的推理网络的无监督模型ConvDMM,它使用非线性发射和转移函数模型的高斯状态空间模型。ConvDMM在语音分类和识别方面表现优异,可以与其他自我监督的方法相辅相成,特别适用于少量标记训练示例的极低资源情况。

🎯

关键要点

  • 提出了一种无监督模型ConvDMM,使用深度卷积神经网络作为推理网络。
  • ConvDMM基于非线性发射和转移函数模型的高斯状态空间模型。
  • 在大规模语音数据集上训练时,ConvDMM在电话分类和识别方面表现优异。
  • ConvDMM的特征优于多个自我监督的特征提取方法。
  • ConvDMM可以与Wav2Vec和PASE等自我监督方法相辅相成,进一步提高结果。
  • 在极低资源情况下,ConvDMM能够更好地学习电话识别器。
➡️

继续阅读