百度大脑 ·

PP-ChatOCRv3新升级：多页PDF信息抽取支持自定义提示词工程，拓展大语言模型功能边界...

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

文本图像信息抽取技术在多个行业得到广泛应用。飞桨低代码工具PaddleX新增PP-ChatOCRv3，结合PaddleOCR和文心一言，实现高效的信息抽取。升级后支持多页PDF快速适配和自定义提示词，提升了信息提取的灵活性与效率。

🎯

🔎

PP-ChatOCRv3通过集成向量检索技术，显著提高了多页PDF文件的信息抽取效率。传统方法在处理大文件时成本较高，而新系统能够先筛选相关内容，再进行信息提取，减少了推理时间。这一改进对于需要快速处理大量文档的行业尤为重要。

PP-ChatOCRv3支持自定义提示词工程，使得用户可以根据具体需求灵活调整提取规则和问题描述。这种灵活性不仅提升了信息抽取的准确性，也拓展了大语言模型的应用场景，适应了不同领域的需求，尤其是在复杂问题的处理上。

新版本提供的数据缓存加载方法，可以有效节约视觉特征和向量库的建立时间。这意味着在初次建立后，后续的信息抽取可以基于缓存数据进行，避免了重复的计算和时间浪费，提升了整体工作效率，适合高频次的信息抽取任务。

❓

PP-ChatOCRv3结合PaddleOCR和文心一言，实现高效的文本图像信息抽取，支持多页PDF快速适配和自定义提示词。

PP-ChatOCRv3集成了向量检索技术，先筛选相关内容，再利用大语言模型进行信息抽取，从而提升效率。

自定义提示词工程允许用户灵活调整提取规则和问题描述，拓展大语言模型在信息抽取方面的功能。

升级后，PP-ChatOCRv3支持多页PDF适配、自定义提示词、数据缓存加载等功能，提升了信息提取的灵活性与效率。

PP-ChatOCRv3广泛应用于自动化办公、建筑工程、教育科研、金融风控和医疗健康等行业。

用户可以扫描二维码预约报名，参加百度研发团队于2月20日举办的直播活动，解读PP-ChatOCRv3技术方案。

🏷️