开源服务指南 ·

赋能 RAG：把文档转换成 Markdown/JSON | 开源日报 No.421

💡 原文中文，约1000字，阅读约需3分钟。

📝

内容提要

Docling 是一款高效的文档解析工具，支持将多种格式转换为 Markdown 和 JSON，具备强大的 PDF 理解能力，能够提取元数据，并与 LlamaIndex 和 LangChain 集成。self-operating-computer 框架使多模态模型能够模拟人类操作，兼容多种模型。dreamgaussian 实现高效的 3D 内容创建，支持从 2D 图像和文本生成 3D 模型。v4-core 是 Uniswap v4 的核心合约，提供灵活的流动性池管理。VisualGLM-6B 是开源的多模态对话模型。

🎯

关键要点

Docling 是一个高效的文档解析工具，支持将多种格式转换为 Markdown 和 JSON。
支持读取多种流行文档格式（PDF、DOCX、PPTX、图像、HTML 等），具备先进的 PDF 理解能力。
能够提取元数据，如标题、作者及语言等信息，并与 LlamaIndex 和 LangChain 集成。
self-operating-computer 框架使多模态模型能够模拟人类操作，兼容多种模型。
dreamgaussian 实现高效的 3D 内容创建，支持从 2D 图像和文本生成 3D 模型。
v4-core 是 Uniswap v4 的核心合约，提供灵活的流动性池管理。
VisualGLM-6B 是开源的多模态对话模型，支持图像、中文和英文。

❓

延伸问答

Docling 是什么？

Docling 是一个高效的文档解析工具，支持将多种格式转换为 Markdown 和 JSON。

Docling 支持哪些文档格式？

Docling 支持 PDF、DOCX、PPTX、图像、HTML 等多种流行文档格式。

Docling 如何提取文档元数据？

Docling 能够提取文档的标题、作者及语言等元数据。

self-operating-computer 框架的功能是什么？

self-operating-computer 框架使多模态模型能够模拟人类操作，兼容多种模型。

dreamgaussian 是什么？

dreamgaussian 是一个用于高效 3D 内容创建的工具，支持从 2D 图像和文本生成 3D 模型。

VisualGLM-6B 有哪些特点？

VisualGLM-6B 是开源的多模态对话模型，支持图像、中文和英文。

🏷️