💡
原文英文,约500词,阅读约需2分钟。
📝
内容提要
Mistral发布了Mistral OCR 3,显著提升了对手写、表单和复杂表格文档的识别准确性,整体胜率达到74%。该模型能够提取文本和嵌入图像,输出为Markdown格式,适合结构化数据需求,用户反馈速度快,语言覆盖广,适用于多种业务场景。
🎯
关键要点
- Mistral发布了Mistral OCR 3,提升了对手写、表单和复杂表格文档的识别准确性,整体胜率达到74%。
- 新模型在真实客户文档工作流程中的内部评估中,较前版本Mistral OCR 2有显著进步。
- Mistral OCR 3能够提取文本和嵌入图像,输出为Markdown格式,适合结构化数据需求。
- 该模型在处理手写内容、表单解析和复杂表格方面表现出色,能够有效应对倾斜、压缩伪影和低分辨率问题。
- 早期用户反馈性能和语言覆盖有显著改善,尤其在荷兰语处理上表现良好。
- Mistral OCR 3的生产部署正在扩大,准确性提升使得可以处理更多类型的文档。
- 该模型定价为每千页2美元,批量API选项可降至每千页1美元,成为企业OCR系统的低成本替代方案。
- Mistral提供自托管部署选项,确保OCR工作负载在受控基础设施内运行。
- Mistral OCR 3现已推出,并与OCR 2完全向后兼容。