朝着真实文本操纵检测的目标:新数据集和新解决方案

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

为了解决合成篡改无法充分复制真实世界篡改属性的问题,研究人员提出了一个包含14250个文本图像的RTM数据集,其中包括手动和自动篡改的图像。他们提出了一个基线解决方案,采用一致性感知的聚合中心和门控交叉邻域注意融合模块,以及被篡改-真实对比学习模块,提高了文本伪造检测的性能。这个框架可以扩展到其他双流体系结构,对手动和总体篡改的定位性能分别提高了7.33%和6.38%。他们的研究旨在推动现实世界文本篡改检测的进展。

🎯

关键要点

  • 为了解决合成篡改无法充分复制真实世界篡改属性的问题,研究人员提出了一个RTM数据集,包含14250个文本图像。

  • RTM数据集包括5986个手动篡改图像、5258个自动篡改图像和3006个未更改的文本图像,用于评估解决方案的稳定性。

  • 评估表明现有的方法在RTM数据集上的文本伪造检测方面存在问题。

  • 研究人员提出了一个基线解决方案,采用一致性感知的聚合中心和门控交叉邻域注意融合模块。

  • 该框架在训练过程中采用被篡改-真实对比学习模块,丰富特征表示的差异。

  • 框架可以扩展到其他双流体系结构,对手动和总体篡改的定位性能分别提高了7.33%和6.38%。

  • 研究旨在推动现实世界文本篡改检测的进展,代码和数据集将在指定网址上提供。

➡️

继续阅读