量子位 ·

AIGC检测为何频频“看走眼”？腾讯优图揭秘：问题可能出在数据源头

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

腾讯优图研究发现，AI生成图像检测器在真实场景中的表现不佳，主要由于训练数据的偏差。为此，提出了“双重数据对齐”方法，通过重构和对齐数据，显著提升了检测器的泛化能力。实验结果显示，该方法在多个基准测试中表现优异，真实场景中的准确率达到82.4%。

🎯

🔎

文章强调，AI生成图像检测器的性能受限于训练数据的质量。偏差特征的存在使得模型在真实场景中的表现不佳，因此，确保训练数据的多样性和代表性是提升检测器泛化能力的关键。

双重数据对齐（DDA）方法通过像素域和频率域的对齐，显著提升了检测器的准确性。这种方法不仅解决了数据偏差问题，还为未来的AI检测技术提供了新的思路，值得关注其在其他领域的应用潜力。

尽管DDA方法在实验中表现优异，但在实际应用中，AI生成图像的多样性和复杂性仍然是检测器面临的挑战。用户在使用这些检测工具时，应意识到可能存在的误判风险，特别是在高风险场景中。

❓

主要是由于训练数据的偏差，检测器依赖于与真伪无关的偏差特征来做出判断。

DDA方法通过重构和对齐训练数据，消除偏差特征，从而提升检测器的泛化能力。

DDA方法包括像素域对齐、频率域对齐和Mixup三个步骤。

DDA方法在11个不同Benchmark中表现领先，真实场景中的准确率达到82.4%。

通过提供无偏的训练数据和采用DDA方法，可以显著提升模型的泛化能力。

主要包括虚假新闻、身份欺诈和版权侵犯等问题。

🏷️