MAT-SED:基于掩蔽重建预训练的掩蔽音频变换器用于声音事件检测
📝
内容提要
本研究解决了传统声音事件检测方法中依赖RNN建模时间依赖性的问题,提出了一种纯变换器基础的声音事件检测模型MAT-SED,采用掩蔽重建预训练策略。该模型在DCASE2023 task4上取得了优于现有研究的性能表现,显示出其在声音事件检测领域的潜在影响。
🏷️
标签
➡️