💡
原文英文,约500词,阅读约需2分钟。
📝
内容提要
LlamaParse持续改进,新增对GPT 4.1和Gemini 2.5 Pro模型的支持,具备自动检测文档方向和倾斜的功能,提供置信度评分,允许设置页面错误容忍度,并优化失败页面的处理方式。
🎯
关键要点
- LlamaParse持续改进,新增对GPT 4.1和Gemini 2.5 Pro模型的支持。
- 新增自动检测文档方向和倾斜的功能,确保文档正确解析。
- 支持检测90º、180º和270º的旋转,并自动调整文档方向。
- 检测1º到12º的轻微倾斜并自动垂直对齐,以提高解析准确性。
- JSON输出中新增originalOrientationAngle属性,指示是否进行了方向修正。
- 每个解析页面现在包含置信度评分,评分范围从0到1,分数越高越好。
- 低于0.2的置信度评分会被标记为低置信度。
- 用户可以设置页面错误容忍度,表示在转换为Markdown时允许的最大失败页面数。
- 新增替换失败页面模式,允许用户选择如何处理无法转换的页面。
- LlamaParse每月免费提供10,000页的解析服务,用户可轻松开始解析项目。
❓
延伸问答
LlamaParse支持哪些新模型?
LlamaParse现在支持OpenAI的GPT 4.1和Google的Gemini 2.5 Pro模型。
LlamaParse如何处理文档的方向和倾斜问题?
LlamaParse能够自动检测90º、180º和270º的旋转,并调整文档方向,同时检测1º到12º的轻微倾斜并自动垂直对齐。
LlamaParse的置信度评分是如何计算的?
置信度评分通过比较原始页面和Markdown的字符计数比例、字母重叠和单词重叠来计算,评分范围从0到1,分数越高越好。
用户如何设置页面错误容忍度?
用户可以通过在API中设置pageErrorTolerance="$value"来指定解析页面的错误容忍度,表示允许的最大失败页面数。
如果LlamaParse无法转换页面,用户可以选择什么处理方式?
用户可以通过设置replace_failed_page_mode="$value"选择处理方式,包括返回原始文本、返回空白页面或返回错误信息。
LlamaParse每月提供多少免费解析服务?
LlamaParse每月免费提供10,000页的解析服务。
🏷️
标签
➡️