Blog on LlamaIndex ·

LlamaParse 更新 2025年5月：新模型、倾斜检测及更多功能

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

LlamaParse持续改进，新增对GPT 4.1和Gemini 2.5 Pro模型的支持，具备自动检测文档方向和倾斜的功能，提供置信度评分，允许设置页面错误容忍度，并优化失败页面的处理方式。

🎯

关键要点

LlamaParse持续改进，新增对GPT 4.1和Gemini 2.5 Pro模型的支持。
新增自动检测文档方向和倾斜的功能，确保文档正确解析。
支持检测90º、180º和270º的旋转，并自动调整文档方向。
检测1º到12º的轻微倾斜并自动垂直对齐，以提高解析准确性。
JSON输出中新增originalOrientationAngle属性，指示是否进行了方向修正。
每个解析页面现在包含置信度评分，评分范围从0到1，分数越高越好。
低于0.2的置信度评分会被标记为低置信度。
用户可以设置页面错误容忍度，表示在转换为Markdown时允许的最大失败页面数。
新增替换失败页面模式，允许用户选择如何处理无法转换的页面。
LlamaParse每月免费提供10,000页的解析服务，用户可轻松开始解析项目。

🔎

延伸解读

新模型的优势

LlamaParse现在支持GPT 4.1和Gemini 2.5 Pro模型，这些模型在解析复杂文档时表现出色。用户可以期待更高的准确性，尤其是在处理PDF、PowerPoint和Word文档时，这对于需要高质量文档解析的行业尤为重要。

自动检测功能的实用性

自动检测文档方向和倾斜的功能显著提高了解析的准确性。对于扫描文档，尤其是方向不正或轻微倾斜的情况，LlamaParse能够自动调整，减少人工干预，提升工作效率。

置信度评分的重要性

新增的置信度评分功能为用户提供了文档解析质量的直观反馈。低于0.2的评分会被标记为低置信度，用户可以据此判断是否需要重新处理或手动检查这些页面，从而优化最终输出的质量。

页面错误容忍度的灵活性

用户现在可以设置页面错误容忍度，这为不同需求的项目提供了灵活性。根据项目的具体要求，用户可以选择允许的最大失败页面数，从而在保证效率的同时，控制输出质量。

❓

延伸问答

LlamaParse支持哪些新模型？

LlamaParse现在支持OpenAI的GPT 4.1和Google的Gemini 2.5 Pro模型。

LlamaParse如何处理文档的方向和倾斜问题？

LlamaParse能够自动检测90º、180º和270º的旋转，并调整文档方向，同时检测1º到12º的轻微倾斜并自动垂直对齐。

LlamaParse的置信度评分是如何计算的？

置信度评分通过比较原始页面和Markdown的字符计数比例、字母重叠和单词重叠来计算，评分范围从0到1，分数越高越好。

用户如何设置页面错误容忍度？

用户可以通过在API中设置pageErrorTolerance="$value"来指定解析页面的错误容忍度，表示允许的最大失败页面数。

如果LlamaParse无法转换页面，用户可以选择什么处理方式？

用户可以通过设置replace_failed_page_mode="$value"选择处理方式，包括返回原始文本、返回空白页面或返回错误信息。

LlamaParse每月提供多少免费解析服务？

LlamaParse每月免费提供10,000页的解析服务。

🏷️