DiffSED:使用降噪扩散的声音事件检测
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
通过生成学习重新构建声音事件检测问题,模型学习逆转噪声处理,能从噪声查询中生成准确的事件边界。实验证明,在Urban-SED和EPIC-Sounds数据集上,模型训练速度更快且优于现有替代方法。
🎯
关键要点
- 通过生成学习重新构建声音事件检测问题。
- 模型学习逆转噪声处理,能够从噪声查询中生成准确的事件边界。
- 实验证明模型在Urban-SED和EPIC-Sounds数据集上训练速度更快。
- 模型收敛速度超过40%,明显优于现有替代方法。
➡️