乐谱变换器:端到端的光学乐谱识别超越单声部转录
原文中文,约300字,阅读约需1分钟。发表于: 。本研究提出了 Sheet Music Transformer 模型,这是首个能够在处理复杂音乐乐谱时不仅依赖于单音技术的端到端光学乐谱识别模型。模型基于 Transformer 的图像到序列框架,能够从输入图像中预测出标准的数字音乐编码格式的乐谱转录。实验结果表明,该模型不仅表现出了高度的能力,而且也优于目前最先进的方法,从而为端到端光学乐谱识别的进步做出了贡献。
本研究提出了Sheet Music Transformer模型,用于预测标准的数字音乐编码格式的乐谱转录。实验证明该模型优于现有方法,为光学乐谱识别的进步做出了贡献。