本文介绍了多个用于音频和视觉分析的数据集,涵盖古典音乐表演、声音活动检测、动作捕捉和音乐信息检索等领域。研究旨在提升音乐和语言的理解与检索能力,推动相关领域的发展。
完成下面两步后,将自动完成登录并继续当前操作。