MTDA-HSED:用于异构声事件检测的互助调优和双分支聚合

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本文提出使用多通道音频中的低级空间特征进行声音事件检测。通过扩展卷积递归神经网络以处理更多类型的特征,并将特征呈现为体积的单独层,可以更好地学习多通道音频中的声音事件。该方法在公开数据集上提高了F-score。

🎯

关键要点

  • 提出使用多通道音频中的低级空间特征进行声音事件检测。
  • 扩展卷积递归神经网络以处理更多类型的多通道特征。
  • 将特征呈现为体积的单独层,而不是串联成单个特征向量,可以更好地学习声音事件。
  • 在TUT-SED 2016数据集上,F-score提高了6.1%。
  • 在TUT-SED 2009数据集上,F-score提高了2.7%。
➡️

继续阅读