本研究提出了一种音频视觉联合学习方法(MACB-DF),旨在解决多模态检测中的学习不平衡问题。该方法通过对比学习促进模态融合,实验结果表明在多个深度伪造数据集上达到了95.5%的准确率,并提升了跨数据集的泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。