DocBinFormer:一种用于有效文档图像二值化的两级 Transformer 网络

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

提出了一种名为DocBinFormer的文档二值化变换器,用于对文档图像进行二值化分析。该架构利用双级变换器编码器从输入图像中捕获全局和局部特征表示,取得了改进的结果,并在DIBCO和H-DIBCO基准数据集上超过了现有技术的表现。

🎯

关键要点

  • 提出了一种名为DocBinFormer的文档二值化变换器。
  • DocBinFormer是基于视觉变换器的两级架构。
  • 该架构用于有效地对文档图像进行二值化分析。
  • 利用双级变换器编码器捕获全局和局部特征表示。
  • 在系统生成和手写文档图像的分析中取得了改进的结果。
  • 在DIBCO和H-DIBCO基准数据集上超过了现有技术的表现。
➡️

继续阅读