百度大脑 ·

PaddleOCR 2.9 发布，正式开源文本图像智能分析利器

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

PaddleOCR 最新发布了 PP-ChatOCRv3-doc，提升了文本图像解析能力，信息抽取效果提高6%。新增7个实用OCR基础模型，支持低代码全流程开发，简化模型使用，兼容多种硬件，提供高效的模型组合与定制，助力行业应用推广。

🎯

❓

PaddleOCR 2.9 发布了 PP-ChatOCRv3-doc，提升了文本图像解析能力，信息抽取效果提高6%，并新增7个实用的OCR基础模型。

PP-ChatOCRv3-doc 集成了图像矫正、版面区域定位、文本检测、表格识别等多个功能。

通过 PaddleX 低代码开发工具，可以实现简单且高效的模型使用、组合与定制，显著减少开发时间和难度。

PaddleOCR 支持多种主流硬件，如英伟达GPU、昆仑芯、昇腾和寒武纪等。

PaddleOCR 提供基于统一命令和图形界面的两种方式，实现模型的高效使用、组合与定制。

PP-ChatOCRv3-doc 的信息抽取效果相比于上一个版本提升了6%。

🏷️