百度大脑 ·

PaddleOCR 3.1 发布：文心助力30+语种文字识别精度提升30%+，关键能力支持MCP

💡 原文中文，约5200字，阅读约需13分钟。

📝

内容提要

PaddleOCR 3.1 更新了多语种文本识别模型，支持37种语言，识别精度提升30%。新增文档翻译工具PP-DocTranslation，支持Markdown、PDF和图片格式翻译，并支持MCP服务器，便于将OCR能力集成到AI应用中。

🎯

🔎

PaddleOCR 3.1 支持37种语言的文本识别，精度提升30%，这为全球化交流提供了强有力的技术支持。随着国际合作的加深，企业和个人在多语种环境下的需求日益增加，PaddleOCR 的升级将有助于提升跨语言沟通的效率，尤其在文档处理和翻译领域。

PP-DocTranslation 工具结合了文档解析和翻译能力，支持Markdown、PDF和图片格式的翻译。用户可以自定义词表，确保专业术语的准确翻译。这一功能特别适合需要处理复杂文档的行业，如法律和技术领域，能够显著提高翻译的效率和质量。

MCP 服务器为 PaddleOCR 提供了标准化的接口，用户可以通过简单步骤将其集成到各种 AI 应用中。支持本地和云服务的多种运行模式，使得开发者能够根据需求灵活调整参数，降低了技术门槛，促进了 OCR 技术的广泛应用。

❓

PaddleOCR 3.1 更新了多语种文本识别模型，支持37种语言，识别精度提升30%，并新增文档翻译工具PP-DocTranslation，支持Markdown、PDF和图片格式翻译。

PP-DocTranslation支持Markdown、PDF和图片格式的文档翻译，并允许用户自定义词表，实现精准翻译。

用户可以通过简单步骤搭建MCP服务器，支持本地Python库、云服务和自托管服务，便于将PaddleOCR能力集成到AI应用中。

PaddleOCR 3.1支持37种语言的文本识别，包括法语、西班牙语、葡萄牙语、俄语、韩语等。

文心4.5通过其强大的视觉和文本理解能力，提升了多语种文字识别的准确性和数据标注的质量。

PaddleOCR 3.1的多语言场景文字识别准确率提升超过30%。

🏷️