基于Transformer的视觉钢琴转录算法

📝

内容提要

本研究针对自动音乐转录中的视觉钢琴转录问题,提出了一种基于Transformer的算法,旨在从视觉信息中提取钢琴演奏的符号表示。该系统结合了钢琴边界框检测模型和音符起始与音高检测模型,能够在不完美的图像裁剪和轻微倾斜的情况下表现出色,展示了其在现场音乐表现转录中的潜在应用价值。

🏷️

标签

➡️

继续阅读