小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
IBM发布Granite-Docling-258M,一款紧凑型视觉语言模型,用于精确的文档转换

IBM研究推出了Granite-Docling-258M,这是一种开源视觉语言模型,专注于高保真文档转文本转换,能够保留复杂的布局和结构。尽管参数仅有2.58亿,但其准确性与更大模型相当,适合文档解析和数据集准备。该模型支持多语言,旨在与Docling库结合,优化企业文档工作流程。

IBM发布Granite-Docling-258M,一款紧凑型视觉语言模型,用于精确的文档转换

InfoQ
InfoQ · 2025-10-08T18:45:00Z
重新定义下一代 OCR:IBM 最新开源 Granite-docling-258M,实现端到端的「结构+内容」统一理解

IBM 开源的多模态文档处理模型 Granite-Docling-258M 能高效将文档转换为机器可读格式,保留布局、表格和公式,解决传统 OCR 系统的识别问题。该模型参数仅 258M,支持多语言,适合企业级文档处理。

重新定义下一代 OCR:IBM 最新开源 Granite-docling-258M,实现端到端的「结构+内容」统一理解

HyperAI超神经
HyperAI超神经 · 2025-09-26T04:22:02Z
IBM AI 发布 Granite-Docling-258M:一个开源、企业级文档 AI 模型

IBM发布了Granite-Docling-258M,这是一个开源视觉语言模型,专注于文档转换,能够准确提取表格、代码和公式,并生成结构化表示。与前版本相比,该模型在布局分析和OCR方面有显著提升,并支持多语言,旨在提高文档处理的效率和准确性。

IBM AI 发布 Granite-Docling-258M:一个开源、企业级文档 AI 模型

实时互动网
实时互动网 · 2025-09-18T02:43:21Z
通过Docling将非结构化数据转化为适合RAG的格式

检索增强生成(RAG)是一种提高大型语言模型(LLM)生成内容准确性的方法。RAG需要合适的数据架构以有效扩展,组织非结构化数据并提取有意义的见解以改善客户服务是主要挑战。Docling是一个开源工具,能够将多种文档格式转换为可用格式,简化数据处理流程,支持RAG工作流。

通过Docling将非结构化数据转化为适合RAG的格式

The New Stack
The New Stack · 2025-08-21T13:00:09Z
使用Docling从文档构建知识图谱

使用Docling构建知识图谱的初步体验。知识图谱通过节点和边结构化信息,便于数据探索与分析。Docling简化了文档提取过程,支持多种格式,提高了信息提取的准确性。示例代码展示了如何从PDF生成知识图谱,提取实体及其关系,实现高效构建。

使用Docling从文档构建知识图谱

DEV Community
DEV Community · 2025-04-23T20:12:09Z
Docling的图形导出 — 将PDF导出为图像

Docling的图形导出功能允许用户将PDF内容导出为图像格式,操作简单,支持多种文档格式,快速实现。用户可以保存页面图像、表格和图片,并生成Markdown和HTML文件,适合处理敏感数据,支持多种集成和OCR。

Docling的图形导出 — 将PDF导出为图像

DEV Community
DEV Community · 2025-03-28T15:42:44Z
使用“Docling Parse”!

Docling Parse是一个简单的Python包,能够从程序化PDF中提取文本、路径和位图图像及其坐标。用户只需安装该包并使用示例代码,即可轻松提取所需内容,适用于PDF转换。

使用“Docling Parse”!

DEV Community
DEV Community · 2025-03-19T17:55:06Z
Docling新款“SmolDocling-256M”震撼登场

SmolDocling-256M-preview是一个多模态图像文本转文本模型,支持高效文档转换,具备OCR、代码识别、公式和图表识别功能,兼容Docling文档,推理速度快。

Docling新款“SmolDocling-256M”震撼登场

DEV Community
DEV Community · 2025-03-17T19:24:16Z
使用Docling和Granite 3.1构建AI驱动的文档检索系统

本文介绍了如何利用先进工具构建AI文档检索系统,包括文档处理、检索增强生成(RAG)和LangChain集成。通过使用Docling解析文档、Granite 3.1大语言模型和LangChain框架,用户将学习高效的数据检索方法。适合具备Python编程基础的AI开发者和研究人员。

使用Docling和Granite 3.1构建AI驱动的文档检索系统

DEV Community
DEV Community · 2025-02-22T18:52:02Z
ROX《基于Docling和Granite 3.1构建AI驱动的文档检索系统》

本文介绍了如何在Jupyter Notebook中使用IBM Granite和Docling实现文档检索增强生成(RAG)功能。作者创建虚拟环境,安装依赖,利用Docling将文档转为结构化数据,并结合Granite LLM进行查询,最终构建了一个从多种文档中提取知识的生成管道。

ROX《基于Docling和Granite 3.1构建AI驱动的文档检索系统》

DEV Community
DEV Community · 2025-01-20T17:39:59Z
我与Docling的首次实践体验

Docling是IBM开发的开源工具,支持多种文档格式(如PDF、DOCX),可导出为Markdown和JSON。它具备高级PDF理解能力,支持OCR,并可与LlamaIndex和LangChain集成。用户可通过Python和tkinter进行文件转换。

我与Docling的首次实践体验

DEV Community
DEV Community · 2024-12-03T15:57:15Z
赋能 RAG:把文档转换成 Markdown/JSON | 开源日报 No.421

Docling 是一款高效的文档解析工具,支持将多种格式转换为 Markdown 和 JSON,具备强大的 PDF 理解能力,能够提取元数据,并与 LlamaIndex 和 LangChain 集成。self-operating-computer 框架使多模态模型能够模拟人类操作,兼容多种模型。dreamgaussian 实现高效的 3D 内容创建,支持从 2D 图像和文本生成 3D 模型。v4-core 是 Uniswap v4 的核心合约,提供灵活的流动性池管理。VisualGLM-6B 是开源的多模态对话模型。

赋能 RAG:把文档转换成 Markdown/JSON | 开源日报 No.421

开源服务指南
开源服务指南 · 2024-11-14T23:35:49Z

本文介绍了多种文档解析技术,如DocParser、DocBank和DocFormer,旨在提升文档结构解析性能。研究表明,基于弱监督学习和多模态方法的模型在文档布局分析中表现优越,能够准确识别复杂排版的文档信息。此外,DocXChain工具链可将非结构化文档转换为结构化表示,提高信息提取效率。

Docling技术报告

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码