本研究构建了包含一百万张标注图像的PsOCR数据集,解决了普什图语OCR中的数据稀缺和文字形态问题。结果表明,Gemini模型表现最佳,Qwen-7B在开源模型中领先,为普什图语OCR研究奠定了基础。
完成下面两步后,将自动完成登录并继续当前操作。