ChordFormer:一种基于Conformer架构的大词汇音频和弦识别方法

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出ChordFormer,结合卷积神经网络与变换器,解决大词汇量音频和弦识别中的样本不足问题,提升了2%的帧级和6%的类别级准确率。

🎯

关键要点

  • 本研究提出ChordFormer,结合卷积神经网络与变换器。
  • 解决了大词汇量音频和弦识别中的样本不足问题。
  • 和弦的长尾分布导致训练样本不足。
  • ChordFormer能够有效捕捉局部模式和全局依赖。
  • 在大的和弦数据集上实现了2%的帧级准确率提升。
  • 在大的和弦数据集上实现了6%的类别级准确率提升。
  • 显著改善了和弦识别的效果。
➡️

继续阅读