小红花·文摘

本研究提出了一种音频视觉联合学习方法（MACB-DF），旨在解决多模态检测中的学习不平衡问题。该方法通过对比学习促进模态融合，实验结果表明在多个深度伪造数据集上达到了95.5%的准确率，并提升了跨数据集的泛化能力。