小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
找遍全网终于发现了这款免费PDF工具,批量转换格式、压缩、修改内容、合并拆分一个工具搞定!

鹰迅批量处理工具箱是一款强大的文档处理工具,支持PDF、Word、Excel等格式,具备批量处理和离线操作功能,确保数据安全。它可以一键处理大量文档,满足添加水印、格式转换、提取数据等需求,显著提高工作效率。

找遍全网终于发现了这款免费PDF工具,批量转换格式、压缩、修改内容、合并拆分一个工具搞定!

小众软件
小众软件 · 2026-06-04T09:14:15Z
“炸毁一切”:供应商在AI代理上犯的一个错误

Hyland公司在CommunityLIVE 2026大会上推出多个平台更新,强调AI代理的有效性依赖于上下文。CEO Jitesh Ghai表示,企业应利用现有系统和数据,而非重建流程。新产品包括企业上下文引擎和代理生命周期管理,旨在简化文档处理和提升工作效率。此外,Hyland推出无头模式,允许开发者通过API访问其AI能力,推动企业数字化转型。

“炸毁一切”:供应商在AI代理上犯的一个错误

The New Stack
The New Stack · 2026-06-01T15:00:32Z
使用LangChain和向量数据库构建生产级RAG系统

本文介绍了一门课程,帮助用户从简单原型过渡到生产级RAG系统。课程内容涵盖文档处理、向量数据库优化、调试和安全性等方面,学习者将掌握构建稳健、安全的AI应用程序所需的技能。课程包括环境设置、RAG系统构建、混合搜索、观察性和安全层设置等。

使用LangChain和向量数据库构建生产级RAG系统

freeCodeCamp.org
freeCodeCamp.org · 2026-05-28T12:52:22Z
C# 结合 llama.cpp 实现 QianfanOCR本地部署,搞定所有卡证识别与结构化输出

Qianfan-OCR是一个本地OCR解决方案,旨在提高文档处理效率并保护数据隐私。该模型集成了文档解析、文字识别和语义理解,支持复杂结构的识别,适合企业使用。用户可通过C# WinForm和llama.cpp在本地完成OCR任务,确保敏感数据安全。

C# 结合 llama.cpp 实现 QianfanOCR本地部署,搞定所有卡证识别与结构化输出

dotNET跨平台
dotNET跨平台 · 2026-05-12T23:58:54Z
开发者说|基于PaddleOCR×LangChain,ClawMaster让文档智能体10分钟跑起来

ClawMaster是一个可视化管理工具,整合了PaddleOCR、OpenClaw和PowerMem,旨在简化文档智能体的构建流程。它支持OCR解析、任务组织和记忆沉淀,实现文档处理的智能化,帮助开发者快速搭建应用,提高效率,并探索Agent的自动运维能力。

开发者说|基于PaddleOCR×LangChain,ClawMaster让文档智能体10分钟跑起来

百度大脑
百度大脑 · 2026-05-11T11:07:51Z
OpenAI GPT-5.5 现已在 Databricks 上可用,通过 Unity AI Gateway 完全管理

Databricks现已支持OpenAI的GPT-5.5,企业用户可以利用其增强的编码工作流和智能数据管道。通过Unity AI Gateway,用户能够安全地使用自然语言与复杂数据互动,构建定制化的智能代理,自动化文档处理流程。GPT-5.5提升了文档解析和推理能力,适用于多种云平台。

OpenAI GPT-5.5 现已在 Databricks 上可用,通过 Unity AI Gateway 完全管理

Databricks
Databricks · 2026-04-24T22:00:00Z
鹰迅OCR:几十种功能集成工具,证件、发票、快递单、扫描件一键提取,省掉手动录入

鹰迅OCR是一款智能文字识别工具,支持批量处理,识别精准且免费。它提供文档处理、证件识别、车辆物流识别和财务票据识别等功能,能够有效提取信息到Excel,简化办公流程,提升工作效率。

鹰迅OCR:几十种功能集成工具,证件、发票、快递单、扫描件一键提取,省掉手动录入

小众软件
小众软件 · 2026-04-21T09:07:09Z
LlamaAgents Builder:从提示到几分钟内部署的AI代理

本文介绍了如何在LlamaCloud平台上使用LlamaAgents Builder快速构建和部署无代码的文档处理AI代理。用户通过自然语言提示创建代理,并将其部署到GitHub应用中,代理能够自动分类文档并提取关键信息,整个过程在几分钟内完成,简化了AI代理的创建和使用。

LlamaAgents Builder:从提示到几分钟内部署的AI代理

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-27T11:00:28Z
【案例共创】华为云码道生成表格提取助手,百份Word表格一键提取,秒变Excel!

华为云码道案例介绍了一种智能开发体系,能够高效生成代码并提供技术咨询,适用于行政和财务等需要处理文档的人员。案例展示了如何使用Python提取Word文档中的表格并保存为Excel文件,从而简化办公流程。

【案例共创】华为云码道生成表格提取助手,百份Word表格一键提取,秒变Excel!

华为云官方博客
华为云官方博客 · 2026-03-18T13:00:00Z
OpenClaw 让 AI 开始“自己干活”,而我发现最先被接管的是 PDF 处理

OpenClaw 是一种新兴的 AI 助手工具,能够自动执行文档处理等任务。UPDF 等工具已实现高亮、编辑、格式转换和 OCR 识别等功能,简化了文件处理。AI 正在从回答问题转向帮助用户完成具体任务。

OpenClaw 让 AI 开始“自己干活”,而我发现最先被接管的是 PDF 处理

小众软件
小众软件 · 2026-03-13T10:17:55Z

AI Doc Helper是一个功能强大的文档处理中心,提供快速写作、精准识别、批量处理和深度调研等服务。该项目开源,支持自定义提示词,适合日常使用。

NAS变身AI学术超人!公式、表格、手写全识别,论文效率起飞!

熊猫不是猫QAQ
熊猫不是猫QAQ · 2026-02-22T10:29:25Z
DigitalOcean Gradient™ AI平台现已与LlamaIndex集成

DigitalOcean Gradient™ AI平台已与LlamaIndex集成,简化了RAG应用的构建。用户只需安装两个包即可连接知识库和LLM,支持文档处理、检索和高吞吐量应用,适用于助手和研究工具等多种场景。

DigitalOcean Gradient™ AI平台现已与LlamaIndex集成

The DigitalOcean Blog
The DigitalOcean Blog · 2026-02-18T20:23:52Z
可在笔记本电脑上运行的七种小型语言模型

本文介绍了七种可在笔记本电脑上运行的小型语言模型,包括Phi-3.5 Mini、Llama 3.2、Ministral 3、Qwen 2.5、Gemma 2和SmolLM2。这些模型适用于文档处理、代码生成和快速原型开发,用户可根据需求选择合适的模型。

可在笔记本电脑上运行的七种小型语言模型

MachineLearningMastery.com
MachineLearningMastery.com · 2026-02-16T11:00:13Z
Grab如何构建视觉大语言模型以扫描图像

Grab团队开发了一种轻量级视觉大语言模型(Vision LLM),旨在提升东南亚语言的文档处理能力。通过合成数据和自动标注框架Documint,优化了OCR和关键信息提取的准确性,最终模型在准确性和延迟方面表现优异,展示了专用模型在文档处理中的潜力。

Grab如何构建视觉大语言模型以扫描图像

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-02-03T16:30:36Z
学习RAG与MCP基础知识

构建AI不仅依赖于智能提示。freeCodeCamp.org的课程教授如何将模型与私有信息结合,利用RAG和MCP技术提升AI的能力与协调性。学习处理文档、存储向量,并构建MCP服务器以实现实际任务。

学习RAG与MCP基础知识

freeCodeCamp.org
freeCodeCamp.org · 2026-01-22T14:34:33Z
Anthropic发布Claude CoWork

2026年1月12日,Anthropic发布了Claude Cowork,一个用于macOS的通用AI代理,旨在自动化文件管理和文档处理。该工具支持多步骤工作流,用户需授予特定目录的访问权限,能够提取数据、生成Excel表格,并支持浏览器自动化,已被多家企业采纳。

Anthropic发布Claude CoWork

InfoQ
InfoQ · 2026-01-20T15:41:00Z
Dify × PaddleOCR:强强联手,深度集成重塑 Agent 工作流智能文档底座

PaddleOCR作为成熟的OCR引擎,提供高效的非结构化文档处理解决方案,已集成至Dify平台,支持多种文档格式的高精度文本提取和结构化输出,帮助企业构建文档驱动型AI应用,简化开发者的集成过程,降低技术门槛。

Dify × PaddleOCR:强强联手,深度集成重塑 Agent 工作流智能文档底座

百度大脑
百度大脑 · 2026-01-16T12:10:58Z
视觉RAG:实现对任意文档的搜索

Vision RAG是一种新型的信息检索和生成技术,能够高效处理复杂文档中的文本和图像。它通过多模态嵌入模型直接索引整个文档,避免了传统OCR的低效和高成本,提升了企业数据的搜索和分析能力,并能从图表和图像中提取关键信息。

视觉RAG:实现对任意文档的搜索

MongoDB
MongoDB · 2026-01-12T16:00:00Z

Gemini 3 Pro是一款先进的多模态模型,具备出色的文档、空间、屏幕和视频理解能力,能够进行复杂的视觉推理和文档处理,准确识别文本、表格和图形,适用于教育、医疗和金融等多个领域。

Gemini 3 Pro:视觉人工智能的前沿

The Keyword
The Keyword · 2025-12-05T16:00:00Z
Cherry Studio × PaddleOCR:技术深度集成,重塑多语言文档解析与智能知识库工作流体验

Cherry Studio是一款开源AI应用,集成了多语言翻译与文档处理功能,利用PaddleOCR提升图像文字识别效率。用户可通过简单设置调用PP-OCRv5模型,快速提取并翻译图像文本,展示了开源技术的协作力量。

Cherry Studio × PaddleOCR:技术深度集成,重塑多语言文档解析与智能知识库工作流体验

百度大脑
百度大脑 · 2025-12-03T13:30:02Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码