朝着真实文本操纵检测的目标:新数据集和新解决方案
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
为了解决合成篡改无法充分复制真实世界篡改属性的问题,研究人员提出了一个包含14250个文本图像的RTM数据集,其中包括手动和自动篡改的图像。他们提出了一个基线解决方案,采用一致性感知的聚合中心和门控交叉邻域注意融合模块,以及被篡改-真实对比学习模块,提高了文本伪造检测的性能。这个框架可以扩展到其他双流体系结构,对手动和总体篡改的定位性能分别提高了7.33%和6.38%。他们的研究旨在推动现实世界文本篡改检测的进展。
🎯
关键要点
-
为了解决合成篡改无法充分复制真实世界篡改属性的问题,研究人员提出了一个RTM数据集,包含14250个文本图像。
-
RTM数据集包括5986个手动篡改图像、5258个自动篡改图像和3006个未更改的文本图像,用于评估解决方案的稳定性。
-
评估表明现有的方法在RTM数据集上的文本伪造检测方面存在问题。
-
研究人员提出了一个基线解决方案,采用一致性感知的聚合中心和门控交叉邻域注意融合模块。
-
该框架在训练过程中采用被篡改-真实对比学习模块,丰富特征表示的差异。
-
框架可以扩展到其他双流体系结构,对手动和总体篡改的定位性能分别提高了7.33%和6.38%。
-
研究旨在推动现实世界文本篡改检测的进展,代码和数据集将在指定网址上提供。
➡️