钢琴乐谱的实用端到端光学音乐识别

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究提出了一种名为TrOMR的基于Transformer的方法,用于端到端的复调OMR。通过引入一种新颖的一致性损失函数和合理的数据注释方法,提高了对复杂乐谱的识别精度。实验证明TrOMR在真实场景中优于当前OMR方法。同时,研究开发了一个TrOMR系统,并构建了一个用于真实世界中的全页乐谱的相机场景数据集。提供了代码和数据集以便于重现。

🎯

关键要点

  • 该研究提出了一种基于Transformer的方法,名为TrOMR。
  • TrOMR用于端到端的复调OMR,具有优秀的全局感知能力。
  • 引入了一种新颖的一致性损失函数和合理的数据注释方法,提高了复杂乐谱的识别精度。
  • 实验证明TrOMR在真实场景中优于当前OMR方法。
  • 研究开发了一个TrOMR系统,并构建了一个全页乐谱的相机场景数据集。
  • 提供了代码和数据集以便于重现。
➡️

继续阅读