DocBinFormer:一种用于有效文档图像二值化的两级 Transformer 网络
原文中文,约300字,阅读约需1分钟。发表于: 。提出了一种名为 DocBinFormer(文档二值化变换器)的基于视觉变换器的两级架构,用于有效地对文档图像进行二值化分析,该架构利用双级变换器编码器从输入图像中有效地捕获全局和局部特征表示,从而在系统生成和手写文档图像的分析中取得了改进的结果,并在 DIBCO 和 H-DIBCO 基准数据集上超过了现有技术的表现。
提出了一种名为DocBinFormer的文档二值化变换器,用于对文档图像进行二值化分析。该架构利用双级变换器编码器从输入图像中捕获全局和局部特征表示,取得了改进的结果,并在DIBCO和H-DIBCO基准数据集上超过了现有技术的表现。