基于Transformer的视觉钢琴转录算法
📝
内容提要
本研究针对自动音乐转录中的视觉钢琴转录问题,提出了一种基于Transformer的算法,旨在从视觉信息中提取钢琴演奏的符号表示。该系统结合了钢琴边界框检测模型和音符起始与音高检测模型,能够在不完美的图像裁剪和轻微倾斜的情况下表现出色,展示了其在现场音乐表现转录中的潜在应用价值。
🏷️
标签
➡️