NotionNext BLOG ·

Pix2Text V1.1 新版发布，支持 PDF 转 Markdown

💡 原文中文，约3100字，阅读约需8分钟。

📝

内容提要

Pix2Text (P2T)是一个Python工具，可以识别图像中的文本和数学公式，并输出相应的文本和LaTeX表达式。它可以将PDF文件转换为Markdown格式，并支持多种语言。P2T集成了布局分析和表格分析模型，可以识别图像中的布局、表格、图像、文本和数学公式。它还提供将Markdown格式转换为Word、HTML和其他格式的功能。P2T有一个每天10,000个字符的网页版本，也可以购买付费模型。

🎯

关键要点

Pix2Text (P2T) 是一个 Python 工具，用于识别图像中的文本和数学公式，并输出相应的文本和 LaTeX 表达式。
P2T 的目标是成为 Mathpix 的免费开源 Python 替代工具。
P2T V1.1 整合了版面分析和表格分析模型，支持识别图片中的版面、表格、图片、文字和数学公式，并以 Markdown 格式输出。
P2T 可以将整个 PDF 文件转换为 Markdown 格式，支持扫描图片和其他格式。
P2T V1.1 支持 80 多种语言的文字识别，包括英文、简体中文、繁体中文和越南语。
P2T 提供将 Markdown 格式转换为 Word、HTML 等其他格式的功能。
P2T 网页版每天可以免费识别 10,000 个字符，支持简体中文和英文。
P2T 的付费版模型提供更高的识别精度，兼容 V1.0 中的所有模型。
用户可以通过购买企业版模型获得更多功能和更好的识别效果。
P2T 在线文档和示例提供了详细的使用说明和效果展示。

❓

延伸问答

Pix2Text V1.1 有哪些主要功能？

Pix2Text V1.1 可以识别图像中的文本和数学公式，支持将 PDF 文件转换为 Markdown 格式，并提供将 Markdown 转换为 Word、HTML 等格式的功能。

Pix2Text 支持哪些语言的文字识别？

Pix2Text 支持超过 80 种语言的文字识别，包括英文、简体中文、繁体中文和越南语。

如何使用 Pix2Text 将 PDF 转换为 Markdown？

用户可以使用 .recognize_pdf() 函数对整个 PDF 文件或指定页进行识别，并将结果输出为 Markdown 文件。

Pix2Text 的网页版本有什么限制？

Pix2Text 的网页版本每天可以免费识别 10,000 个字符，并且当前只支持简体中文和英文。

Pix2Text V1.1 与 V1.0 有什么不同？

Pix2Text V1.1 增加了完整的版面恢复能力，并支持将整个 PDF 文件转换为 Markdown 格式，而 V1.0 主要提供更高精度的公式识别模型。

如何购买 Pix2Text 的付费模型？

用户可以通过 Pix2Text 的模型购买商店购买企业版模型，购买后可以下载对应的模型文件。

🏷️