MTDA-HSED:用于异构声事件检测的互助调优和双分支聚合
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本文提出使用多通道音频中的低级空间特征进行声音事件检测。通过扩展卷积递归神经网络以处理更多类型的特征,并将特征呈现为体积的单独层,可以更好地学习多通道音频中的声音事件。该方法在公开数据集上提高了F-score。
🎯
关键要点
- 提出使用多通道音频中的低级空间特征进行声音事件检测。
- 扩展卷积递归神经网络以处理更多类型的多通道特征。
- 将特征呈现为体积的单独层,而不是串联成单个特征向量,可以更好地学习声音事件。
- 在TUT-SED 2016数据集上,F-score提高了6.1%。
- 在TUT-SED 2009数据集上,F-score提高了2.7%。
➡️