ChordFormer:一种基于Conformer架构的大词汇音频和弦识别方法
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出ChordFormer,结合卷积神经网络与变换器,解决大词汇量音频和弦识别中的样本不足问题,提升了2%的帧级和6%的类别级准确率。
🎯
关键要点
- 本研究提出ChordFormer,结合卷积神经网络与变换器。
- 解决了大词汇量音频和弦识别中的样本不足问题。
- 和弦的长尾分布导致训练样本不足。
- ChordFormer能够有效捕捉局部模式和全局依赖。
- 在大的和弦数据集上实现了2%的帧级准确率提升。
- 在大的和弦数据集上实现了6%的类别级准确率提升。
- 显著改善了和弦识别的效果。
🏷️
标签
➡️