解道jdon.com -
Marker:快速、高精度地将 PDF 转换为 Markdown的免费工具
Marker 将 PDF、EPUB 和 MOBI 转换为 Markdown。它比 nougat 快 10 倍,比 arXiv 更准确,而且幻觉风险很低。 Marker 针对吞吐量进行了优化,比如转换 LLM 预训练数据。在大多数文档上更准确,并且产生幻觉的风险较低。 支持一系列 PDF 文档(针对书籍和科学论文进行了优化) 删除页眉/页脚/其他工件 将大多数方程转换为乳胶 设置代码块和表格的格式 支持多种语言(尽管大多数测试是用英语完成的)。请参阅settings.py参考资料 获取语言列表。
AI生成摘要 Marker是一个将PDF、EPUB和MOBI转换为Markdown的工具,速度比nougat快10倍,准确度比arXiv高,幻觉风险低。支持PDF文档转换,删除页眉页脚,转换方程为乳胶,设置代码块和表格格式。适用于GPU、CPU或MPS。Marker使用深度学习模型进行文本提取、OCR、页面布局检测、清理和格式化。Marker速度快且准确,适用于各种PDF文档。