PaddleOCR-VL-1.5发布问鼎双榜,0.9B小钢炮攻克“曲面”文档!

PaddleOCR-VL-1.5发布问鼎双榜,0.9B小钢炮攻克“曲面”文档!

💡 原文中文,约2900字,阅读约需7分钟。
📝

内容提要

PaddleOCR于2025年推出PaddleOCR-VL-1.5,具备94.5%精度,支持异形框定位,提升文本行和印章识别能力。该模型在复杂场景中表现优异,已开源,用户可通过官网和API使用。新版本优化了推理速度,支持多语种和跨页表格合并,旨在提升文档解析的准确性和效率。

🎯

关键要点

  • PaddleOCR-VL-1.5于2025年推出,具备94.5%的精度,支持异形框定位。
  • 该模型在复杂场景中表现优异,新增印章识别与文本行定位能力。
  • PaddleOCR-VL-1.5已开源,用户可通过官网和API使用,支持多种硬件平台。
  • 模型推理速度显著提升,能够每秒处理1.43个文档页,较上一代提速17%。
  • 新增跨页表格自动合并与跨页段落标题识别能力,提升文档解析的准确性和效率。

延伸问答

PaddleOCR-VL-1.5的主要特点是什么?

PaddleOCR-VL-1.5具备94.5%的精度,支持异形框定位,新增印章识别与文本行定位能力,推理速度提升17%。

PaddleOCR-VL-1.5如何提升文档解析的准确性?

通过支持异形框定位和新增跨页表格自动合并与段落标题识别,PaddleOCR-VL-1.5提升了文档解析的准确性和效率。

用户如何获取PaddleOCR-VL-1.5?

用户可以通过PaddleOCR官网或API获取PaddleOCR-VL-1.5,代码和模型已开源至Github和HuggingFace。

PaddleOCR-VL-1.5在复杂场景中的表现如何?

PaddleOCR-VL-1.5在扫描、倾斜、弯折等复杂场景中表现优异,能够精准识别文本和表格。

PaddleOCR-VL-1.5的推理速度有多快?

PaddleOCR-VL-1.5在A100上每秒可处理1.43个文档页,较上一代提速17%。

PaddleOCR-VL-1.5支持哪些语言?

PaddleOCR-VL-1.5扩展了对多语种的支持,包括藏语和孟加拉语。

➡️

继续阅读