该研究提出了OneAVM联合学习框架,可用于音频-视频源定位、分离和识别任务。该框架在多个数据集上证明了有效性,并在音频-视觉源定位、分离和最近邻识别任务之间展现了强大的正向转移。
该研究提出了一种名为OneAVM的联合学习框架,用于音频-视频源定位、分离和识别任务。通过三个目标进行训练,证明了OneAVM的有效性,并展现了强大的正向转移。
完成下面两步后,将自动完成登录并继续当前操作。