UPOCR是一种通用模型,用于统一的像素级光学字符识别接口。该模型通过图像转化和基于视觉Transformer的编码器-解码器结构统一了多样的OCR任务的范式,并引入可学习的任务提示使解码器具有任务感知性。实验结果显示,该方法在三个像素级OCR任务上表现出最先进的性能,为通用OCR模型的研究提供了有价值的策略和见解。
完成下面两步后,将自动完成登录并继续当前操作。