💡
原文英文,约500词,阅读约需2分钟。
📝
内容提要
Docling Parse是一个简单的Python包,能够从程序化PDF中提取文本、路径和位图图像及其坐标。用户只需安装该包并使用示例代码,即可轻松提取所需内容,适用于PDF转换。
🎯
关键要点
-
Docling Parse是一个简单的Python包,用于从程序化PDF中提取文本、路径和位图图像及其坐标。
-
该包用于Docling PDF转换,用户可以轻松提取所需内容。
-
安装Docling Parse非常简单,只需使用命令:pip install docling-parse。
-
用户可以通过示例代码对PDF文件进行解析,提取文本和图像。
-
可以使用命令行工具进行可视化,支持不同的单元类型(字符、单词、行)。
-
Docling Parse是Docling工具集中的一部分,适合提取程序化PDF中的内容。
❓
延伸问答
Docling Parse是什么?
Docling Parse是一个简单的Python包,用于从程序化PDF中提取文本、路径和位图图像及其坐标。
如何安装Docling Parse?
可以通过命令行使用命令:pip install docling-parse来安装Docling Parse。
Docling Parse可以提取哪些内容?
Docling Parse可以提取文本、路径和位图图像及其坐标。
如何使用Docling Parse解析PDF文件?
用户可以通过示例代码加载PDF文件并使用DoclingPdfParser进行解析。
Docling Parse支持哪些输出类型?
Docling Parse支持字符、单词和行级别的输出类型。
Docling Parse的可视化功能如何使用?
可以通过命令行运行可视化工具,使用命令:poetry run python ./docling_parse/visualize.py -i <path-to-pdf-file> -c word --interactive。
➡️