AI作曲缺数据,浙大GTSinger数据集上线:适配所有歌声任务、带有真实乐谱

AI作曲缺数据,浙大GTSinger数据集上线:适配所有歌声任务、带有真实乐谱

💡 原文中文,约3500字,阅读约需9分钟。
📝

内容提要

浙江大学研究团队推出了GTSinger,一个大型开源歌声数据集,包含80.59小时的专业录制歌声,涵盖九种语言和多种歌唱技巧。数据集提供真实乐谱和朗读数据,适用于多种歌声任务。研究者确保数据质量,并在多个任务上进行测试,未来计划扩展数据的多样性。

🎯

关键要点

  • 浙江大学研究团队推出GTSinger,一个大型开源歌声数据集,包含80.59小时的专业录制歌声。
  • GTSinger涵盖九种语言和多种歌唱技巧,提供真实乐谱和朗读数据,适用于多种歌声任务。
  • 研究者确保数据质量,并在多个任务上进行测试,未来计划扩展数据的多样性。
  • 传统歌声任务面临缺乏高质量和多任务的开源歌声数据集的挑战。
  • GTSinger的优势包括专业录音、丰富的语言和风格多样性、对照组和音素级技巧标注。
  • 数据集的收集流程包括音频录制、人工标注和后续处理,确保数据的高质量。
  • GTSinger在技巧可控的歌声合成、技巧识别、歌声风格迁移和语音到歌声转换等任务上进行了基准测试。
  • 未来工作将扩展数据的多样性,涵盖更多语言和技巧,并研发基于字级别的模型。

延伸问答

GTSinger数据集的主要特点是什么?

GTSinger数据集包含80.59小时的专业录制歌声,涵盖九种语言和多种歌唱技巧,提供真实乐谱和朗读数据,适用于多种歌声任务。

GTSinger数据集如何解决传统歌声任务面临的挑战?

GTSinger通过提供高质量的录音、丰富的语言和风格多样性、技巧对照组和真实乐谱,解决了传统歌声任务缺乏高质量数据集的问题。

GTSinger数据集的收集流程是怎样的?

GTSinger的收集流程包括音频录制、人工标注和后续处理,确保数据的高质量和准确性。

GTSinger在歌声合成任务上进行了哪些基准测试?

GTSinger在技巧可控的歌声合成、技巧识别、歌声风格迁移和语音到歌声转换等任务上进行了全面评估。

未来GTSinger数据集的扩展计划是什么?

未来计划扩展数据的多样性,涵盖更多语言和技巧,并研发基于字级别的模型。

GTSinger数据集的录制质量如何保证?

GTSinger的数据录制由专业歌手在专业录音棚中进行,确保了录音的高质量。

➡️

继续阅读