DiffSED:使用降噪扩散的声音事件检测

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

通过生成学习重新构建声音事件检测问题,模型学习逆转噪声处理,能从噪声查询中生成准确的事件边界。实验证明,在Urban-SED和EPIC-Sounds数据集上,模型训练速度更快且优于现有替代方法。

🎯

关键要点

  • 通过生成学习重新构建声音事件检测问题。
  • 模型学习逆转噪声处理,能够从噪声查询中生成准确的事件边界。
  • 实验证明模型在Urban-SED和EPIC-Sounds数据集上训练速度更快。
  • 模型收敛速度超过40%,明显优于现有替代方法。
➡️

继续阅读