Pix2Text V1.1 新版发布,支持 PDF 转 Markdown
原文中文,约3100字,阅读约需8分钟。发表于: 。Pix2Text (P2T) V1.1 发布,整合了版面分析和表格识别模型,可以把复杂排版的图片甚至 pdf 文件恢复成 Markdown 格式。
Pix2Text (P2T)是一个Python工具,可以识别图像中的文本和数学公式,并输出相应的文本和LaTeX表达式。它可以将PDF文件转换为Markdown格式,并支持多种语言。P2T集成了布局分析和表格分析模型,可以识别图像中的布局、表格、图像、文本和数学公式。它还提供将Markdown格式转换为Word、HTML和其他格式的功能。P2T有一个每天10,000个字符的网页版本,也可以购买付费模型。