对抗式学习的鲁棒音频深度伪造检测(CLAD)

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究发现预训练视觉-语言模型与先进适应方法相结合在深假检测中有效。通过简单的适应策略,使用较少的训练数据,该模型在准确率上超过先前方法。在严格测试中,该模型在不同数据集中展现了实际适用性。

🎯

关键要点

  • 研究探索了预训练视觉-语言模型与先进适应方法结合在深假检测中的有效性。
  • 保留视觉和文本部分对于检测效果至关重要。
  • 提出了简单轻量级的 Prompt Tuning 适应策略,使用较少的训练数据。
  • 该模型在 mAP 和准确率上超过先前的方法,分别提高了 5.01% 和 6.61%。
  • 在 21 个不同数据集的严格测试中,该模型展现了实际适用性,包括基于 GANs、基于 Diffusion 和商业工具生成的图像。
➡️

继续阅读