LlamaParse 更新 2025年5月:新模型、倾斜检测及更多功能

LlamaParse 更新 2025年5月:新模型、倾斜检测及更多功能

💡 原文英文,约500词,阅读约需2分钟。
📝

内容提要

LlamaParse持续改进,新增对GPT 4.1和Gemini 2.5 Pro模型的支持,具备自动检测文档方向和倾斜的功能,提供置信度评分,允许设置页面错误容忍度,并优化失败页面的处理方式。

🎯

关键要点

  • LlamaParse持续改进,新增对GPT 4.1和Gemini 2.5 Pro模型的支持。
  • 新增自动检测文档方向和倾斜的功能,确保文档正确解析。
  • 支持检测90º、180º和270º的旋转,并自动调整文档方向。
  • 检测1º到12º的轻微倾斜并自动垂直对齐,以提高解析准确性。
  • JSON输出中新增originalOrientationAngle属性,指示是否进行了方向修正。
  • 每个解析页面现在包含置信度评分,评分范围从0到1,分数越高越好。
  • 低于0.2的置信度评分会被标记为低置信度。
  • 用户可以设置页面错误容忍度,表示在转换为Markdown时允许的最大失败页面数。
  • 新增替换失败页面模式,允许用户选择如何处理无法转换的页面。
  • LlamaParse每月免费提供10,000页的解析服务,用户可轻松开始解析项目。

延伸问答

LlamaParse支持哪些新模型?

LlamaParse现在支持OpenAI的GPT 4.1和Google的Gemini 2.5 Pro模型。

LlamaParse如何处理文档的方向和倾斜问题?

LlamaParse能够自动检测90º、180º和270º的旋转,并调整文档方向,同时检测1º到12º的轻微倾斜并自动垂直对齐。

LlamaParse的置信度评分是如何计算的?

置信度评分通过比较原始页面和Markdown的字符计数比例、字母重叠和单词重叠来计算,评分范围从0到1,分数越高越好。

用户如何设置页面错误容忍度?

用户可以通过在API中设置pageErrorTolerance="$value"来指定解析页面的错误容忍度,表示允许的最大失败页面数。

如果LlamaParse无法转换页面,用户可以选择什么处理方式?

用户可以通过设置replace_failed_page_mode="$value"选择处理方式,包括返回原始文本、返回空白页面或返回错误信息。

LlamaParse每月提供多少免费解析服务?

LlamaParse每月免费提供10,000页的解析服务。

➡️

继续阅读