IBM发布Granite-Docling-258M,一款紧凑型视觉语言模型,用于精确的文档转换

IBM发布Granite-Docling-258M,一款紧凑型视觉语言模型,用于精确的文档转换

InfoQ InfoQ ·

IBM研究推出了Granite-Docling-258M,这是一种开源视觉语言模型,专注于高保真文档转文本转换,能够保留复杂的布局和结构。尽管参数仅有2.58亿,但其准确性与更大模型相当,适合文档解析和数据集准备。该模型支持多语言,旨在与Docling库结合,优化企业文档工作流程。

原文英文,约500词,阅读约需2分钟。
阅读原文