IBM研究推出了Granite-Docling-258M,这是一种开源视觉语言模型,专注于高保真文档转文本转换,能够保留复杂的布局和结构。尽管参数仅有2.58亿,但其准确性与更大模型相当,适合文档解析和数据集准备。该模型支持多语言,旨在与Docling库结合,优化企业文档工作流程。
IBM 开源的多模态文档处理模型 Granite-Docling-258M 能高效将文档转换为机器可读格式,保留布局、表格和公式,解决传统 OCR 系统的识别问题。该模型参数仅 258M,支持多语言,适合企业级文档处理。
完成下面两步后,将自动完成登录并继续当前操作。