神经变换框架用于马尔默猴 vocalization 的分割、分类和呼叫者识别的同时任务

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究通过帧级别检测大象叫声,使用音频频谱变换器(AST),实现了0.962的平均精度,显著提升了分类性能,为大象保护和环境管理提供支持。

🎯

关键要点

  • 本研究解决了在持续录音中检测、隔离和分类大象叫声的问题。
  • 自动化叫声特征化可为保护工作提供支持,并帮助制定环境管理策略。
  • 研究采用音频频谱变换器(AST)进行帧级别叫声检测,显著改善性能。
  • 最高帧一级别的平均精度(AP)为0.962,接收器操作特征(AUC)显著提高。
  • 该研究为实现全面自动化的大象叫声检测和子叫声分类系统铺平了道路,具有重要的保护与管理意义。
➡️

继续阅读