对抗式学习的鲁棒音频深度伪造检测(CLAD)
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究发现预训练视觉-语言模型与先进适应方法相结合在深假检测中有效。通过简单的适应策略,使用较少的训练数据,该模型在准确率上超过先前方法。在严格测试中,该模型在不同数据集中展现了实际适用性。
🎯
关键要点
- 研究探索了预训练视觉-语言模型与先进适应方法结合在深假检测中的有效性。
- 保留视觉和文本部分对于检测效果至关重要。
- 提出了简单轻量级的 Prompt Tuning 适应策略,使用较少的训练数据。
- 该模型在 mAP 和准确率上超过先前的方法,分别提高了 5.01% 和 6.61%。
- 在 21 个不同数据集的严格测试中,该模型展现了实际适用性,包括基于 GANs、基于 Diffusion 和商业工具生成的图像。
🏷️
标签
➡️