💡 原文英文,约500词,阅读约需2分钟。
📝

内容提要

Mistral发布了Mistral OCR 3,显著提升了对手写、表单和复杂表格文档的识别准确性,整体胜率达到74%。该模型能够提取文本和嵌入图像,输出为Markdown格式,适合结构化数据需求,用户反馈速度快,语言覆盖广,适用于多种业务场景。

🎯

关键要点

  • Mistral发布了Mistral OCR 3,提升了对手写、表单和复杂表格文档的识别准确性,整体胜率达到74%。
  • 新模型在真实客户文档工作流程中的内部评估中,较前版本Mistral OCR 2有显著进步。
  • Mistral OCR 3能够提取文本和嵌入图像,输出为Markdown格式,适合结构化数据需求。 金句 1
  • 该模型在处理手写内容、表单解析和复杂表格方面表现出色,能够有效应对倾斜、压缩伪影和低分辨率问题。
  • 早期用户反馈性能和语言覆盖有显著改善,尤其在荷兰语处理上表现良好。
  • Mistral OCR 3的生产部署正在扩大,准确性提升使得可以处理更多类型的文档。
  • 该模型定价为每千页2美元,批量API选项可降至每千页1美元,成为企业OCR系统的低成本替代方案。
  • Mistral提供自托管部署选项,确保OCR工作负载在受控基础设施内运行。
  • Mistral OCR 3现已推出,并与OCR 2完全向后兼容。