本文提出了三个新的音频、歌词和双模MER研究数据集,合称为MERGE,解决了双模音频-歌词系统发展中的数据库匮乏问题。实验结果表明,使用深度神经网络在双模分类任务上取得了79.21%的最佳综合F1分数。
完成下面两步后,将自动完成登录并继续当前操作。