光学音乐识别中的知识发现:通过实例分割增强信息检索
原文中文,约500字,阅读约需1分钟。发表于: 。本研究解决了光学音乐识别(OMR)在处理复杂音乐符号时的精确度不足问题。通过应用Mask R-CNN的实例分割技术,研究创新性地提高了对乐谱中音乐符号的检测与区分能力,从而实现更高效的信息检索。实验证明,在密集符号环境下,该方法的平均精确度达到59.70%,显示了其在音乐符号识别领域的潜在影响。
自动音乐转录(AMT)是将音频信号转换为音乐符号表示的核心挑战。本文回顾了AMT在音乐信号分析中的作用,并探讨了当前模型和方法的进展和限制。尽管有进展,AMT系统尚未达到人类专家的准确度。本综述批判性评估了全自动和半自动的AMT系统,并提出改进的途径,以缩小当前系统和人类级转录准确性之间的差距。该研究为克服AMT中的挑战提供了一个路线图。