主动鸟声嵌入:基于 Transformer 的端到端鸟声监测
原文中文,约500字,阅读约需2分钟。发表于: 。我们提出将自我监督(SSL)和深度主动学习(DAL)结合起来,转向端到端学习进行鸟类声音监测。利用 Transformer 模型,我们旨在绕过传统的频谱图转换,实现直接的原始音频处理。通过 SSL,ActiveBird2Vec 将生成高质量的鸟类声音表示,可能加快对风电场环境变化和决策过程的评估。此外,我们还计划通过 DAL 利用多种鸟类鸣叫声,减少对人工专家 extensively...
本文提出了将自我监督学习(SSL)和深度主动学习(DAL)结合起来,通过Transformer模型实现鸟类声音监测。通过SSL,ActiveBird2Vec生成高质量的鸟类声音表示,通过DAL减少对专家标注数据集的依赖。计划通过Huggingface Datasets整理一套全面的任务,评估不同Transformer模型在鸟声识别任务上的熟练程度。旨在加速鸟类声学研究进展并为保护策略作出贡献。