深度调研开源 PDF 转 Markdown 工具:Marker、MinerU 与替代方案

📝

内容提要

所有这些工具都有一个通病,就是对 PDF 的文档目录结构识别不够准确,尤其是多级标题和章节顺序,有时会出现错乱,需人工后期调整。笔者在测试中发现,Marker 对图片的处理较为出色,可以保存高清的原文档图片,但对复杂表格的支持相对较弱。本文系统对比了 Dolphin、MarkItDown、MinerU、Marker 等主流开源 PDF 转 Markdown...

🏷️

标签

➡️

继续阅读