噪声角度添加混合损失与混合检测的声音异常检测

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该文介绍了一种无监督异常声音检测(ASD)的训练技术,通过表示学习和产生紧凑的类内和互不重叠的类间分布,保证异常数据的表示空间。同时,提出了一种提取重要时间区域特征的结构。实验结果表明,该方法在 DCASE 2020 Challenge Task2 数据集上相对于最先进的方法,AUC、pAUC 和 mAUC 分别提高了 0.90%、0.83%和 2.16%。

🎯

关键要点

  • 无监督异常声音检测(ASD)旨在通过学习正常操作声音的特征来识别异常声音。
  • 近期研究集中于自监督任务,利用正常数据的分类。
  • 先进模型的研究表明,通过表示学习及产生紧凑的类内和互不重叠的类间分布,保证异常数据的表示空间是重要的。
  • 传统方法通常无法确保足够的类内紧凑性,并存在样本与其相应中心之间的角差异。
  • 本文提出了一种训练技术,旨在确保类内紧凑性并增加正常和异常样本之间的角间隔。
  • 提出了一种提取重要时间区域特征的结构,使模型能够学习哪些时间帧应该被强调或抑制。
  • 实验结果表明,该方法在 DCASE 2020 Challenge Task2 数据集上相对于最先进的方法,AUC、pAUC 和 mAUC 分别提高了 0.90%、0.83%和 2.16%。
➡️

继续阅读