AIGC检测为何频频“看走眼”?腾讯优图揭秘:问题可能出在数据源头
💡
原文中文,约2700字,阅读约需7分钟。
📝
内容提要
腾讯优图研究发现,AI生成图像检测器在真实场景中的表现不佳,主要由于训练数据的偏差。为此,提出了“双重数据对齐”方法,通过重构和对齐数据,显著提升了检测器的泛化能力。实验结果显示,该方法在多个基准测试中表现优异,真实场景中的准确率达到82.4%。
🎯
关键要点
- 腾讯优图研究发现AI生成图像检测器在真实场景中的表现不佳,主要由于训练数据的偏差。
- 提出了双重数据对齐(DDA)方法,通过重构和对齐数据,显著提升检测器的泛化能力。
- 实验结果显示,DDA方法在多个基准测试中表现优异,真实场景中的准确率达到82.4%。
- 检测器依赖于与真伪无关的偏差特征,导致在真实应用中性能下降。
- 真实图像和AI生成图像在格式、语义和尺寸上存在偏差。
- DDA方法包括像素域对齐、频率域对齐和Mixup三个步骤,消除数据偏差。
- 在严格的评测标准下,DDA在11个不同Benchmark中表现领先,安全下限指标高出第二名27.5个百分点。
- 无偏的训练数据有助于提升模型的泛化能力,强调数据质量的重要性。
➡️