小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
文心飞桨 x OceanBase深圳站:携手硬件伙伴打通Agent生产落地链路

4月25日,百度文心飞桨与OceanBase等企业在深圳举办技术活动,探讨AI Agent的演进及其在企业环境中的应用。专家分享了数据底座、文档资产化与智能硬件的结合。百度飞桨发布PaddleOCR 3.5,提升文档解析能力,助力企业将文档转化为知识资产,推动AI技术在真实场景中的落地。

文心飞桨 x OceanBase深圳站:携手硬件伙伴打通Agent生产落地链路

百度大脑
百度大脑 · 2026-04-29T12:07:19Z
技术深度揭秘|云知声U1-OCR架构升级 + API 开放,重构 OCR 3.0 时代

云知声发布了工业级文档智能基础大模型Unisound U1-OCR,标志着OCR 3.0时代的到来。该模型具备高效部署和强适配能力,支持金融、医疗等行业的复杂文档解析,提升了文档结构理解和阅读顺序恢复能力,解决了传统OCR的局限性,推动行业数字化转型。

技术深度揭秘|云知声U1-OCR架构升级 + API 开放,重构 OCR 3.0 时代

量子位
量子位 · 2026-04-21T04:50:16Z
飞桨星河社区月度报告(2026年3月)

PaddleOCR及其社区进行了多项功能和资源更新,包括提升文档解析体验、新增模型、丰富项目和数据集资源。推出了技术实战专栏,帮助开发者解决实际问题。同时,PaddleOCR OCEAN生态联盟成立,促进了社区的生态共建与技术发展。

飞桨星河社区月度报告(2026年3月)

百度大脑
百度大脑 · 2026-04-07T11:36:35Z
在线教程丨华中科大与小红书 hi lab开源dots.mocr,SOTA级OCR模型完美还原文档结构,图形也能转 SVG

华中科技大学与小红书hi lab联合开源了dots.mocr,旨在解决传统OCR在复杂文档解析中的不足。该工具能够将文字、图表等视觉元素解析为结构化数据,并转换为可编辑的SVG代码,提升文档理解和自动化处理能力。HyperAI官网已上线相关教程,用户可在线体验。

在线教程丨华中科大与小红书 hi lab开源dots.mocr,SOTA级OCR模型完美还原文档结构,图形也能转 SVG

HyperAI超神经
HyperAI超神经 · 2026-04-01T11:28:09Z
手把手部署教学+官方skills,在星河社区免费玩转小龙虾!

OpenClaw在开发者中越来越受欢迎,但许多人在使用时遇到问题。星河社区提供免费的CPU云端环境,帮助用户快速部署OpenClaw。文章介绍了如何配置和安装三个核心技能,使OpenClaw从“玩具”转变为“工具”,以解决文档解析和文字识别等实际问题。

手把手部署教学+官方skills,在星河社区免费玩转小龙虾!

百度大脑
百度大脑 · 2026-03-23T12:31:10Z
01Agent×百度AI:终结“AI生图无法修改”的难题,让每张图都真正可编辑!

01Agent是一款智能内容创作工具,结合PaddleOCR-VL-1.5和ERNIE-5.0,支持高效解析文档和二次创作。用户可上传图片和PDF,系统自动提取结构化信息,提升创作效率。通过识别与编辑图像元素,用户可以灵活修改内容,实现持续生产与复用。

01Agent×百度AI:终结“AI生图无法修改”的难题,让每张图都真正可编辑!

百度大脑
百度大脑 · 2026-02-12T12:35:54Z
OpenClaw × PaddleOCR:开箱即用!将文档解析 Skill 能力注入你的 Agent 工具

OpenClaw推出了PaddleOCR文档解析技能,支持多种文档格式和语言,自动分析文档结构并输出结构化数据,降低集成成本,提高开发效率。PaddleOCR从独立服务转变为可组合的标准化节点,助力知识库构建和自动化处理。

OpenClaw × PaddleOCR:开箱即用!将文档解析 Skill 能力注入你的 Agent 工具

百度大脑
百度大脑 · 2026-02-10T10:55:58Z
RAGFlow x PaddleOCR:联动知名开源伙伴,打造端到端高精度文档解析新范式

RAGFlow是一款开源RAG引擎,集成了PaddleOCR-VL-1.5,提升了文档解析能力。新版本增强了复杂文档的结构化转换,支持多边形元素定位和跨页识别,确保高质量的语义切分和引用追溯,提高了文档型RAG的可用性与可信度,助力企业级知识管理。

RAGFlow x PaddleOCR:联动知名开源伙伴,打造端到端高精度文档解析新范式

百度大脑
百度大脑 · 2026-02-09T09:40:52Z
Pathway × PaddleOCR:握手知名开源框架,打通“动态文档”到实时 RAG 的数据入口

PaddleOCR与Pathway深度集成,实现实时文档解析。通过PaddleOCRParser,Pathway高效处理动态文档,提供结构化数据,支持实时更新与索引,降低运维成本,提升系统可靠性,满足企业文档数字化需求。

Pathway × PaddleOCR:握手知名开源框架,打通“动态文档”到实时 RAG 的数据入口

百度大脑
百度大脑 · 2026-02-06T13:25:55Z
Haystack × PaddleOCR:海外开源伙伴+1!构建面向 RAG 与 Agent 的统一文档解析入口

PaddleOCR与Haystack深度集成,提升了文档解析能力,支持复杂文档的结构化处理。PaddleOCR-VL-1.5可直接接入Haystack Pipeline,实现高精度解析,优化RAG和Agent工作流,满足企业级应用需求。此集成简化了文档入库流程,提高了数据可追溯性和检索准确性,推动了AI在文档密集场景中的应用。

Haystack × PaddleOCR:海外开源伙伴+1!构建面向 RAG 与 Agent 的统一文档解析入口

百度大脑
百度大脑 · 2026-02-04T13:10:46Z

百度开源新一代OCR模型PaddleOCR-VL-1.5,实现全球首个“异形框定位”能力,精度达到94.5%。该模型在复杂文档解析中表现优异,支持多语种识别,推动OCR技术应用落地。

性能超越DeepSeek-OCR2,百度发布并开源新一代SOTA OCR模型

量子位
量子位 · 2026-01-30T06:10:24Z
PaddleOCR-VL-1.5发布问鼎双榜,0.9B小钢炮攻克“曲面”文档!

PaddleOCR于2025年推出PaddleOCR-VL-1.5,具备94.5%精度,支持异形框定位,提升文本行和印章识别能力。该模型在复杂场景中表现优异,已开源,用户可通过官网和API使用。新版本优化了推理速度,支持多语种和跨页表格合并,旨在提升文档解析的准确性和效率。

PaddleOCR-VL-1.5发布问鼎双榜,0.9B小钢炮攻克“曲面”文档!

百度大脑
百度大脑 · 2026-01-29T12:16:02Z
七大开源OCR模型

本文介绍了七种可本地运行的光学字符识别(OCR)模型,如olmOCR-2、PaddleOCR v5和OCRFlux 3B,能够高效将文档、表格和图形转换为准确的Markdown文本,支持多语言、跨页合并和视频处理,适用于多种文档解析需求。

七大开源OCR模型

KDnuggets
KDnuggets · 2025-12-24T13:00:41Z
PaddleOCR官网升级:文心最强衍生模型PaddleOCR-VL体验升级,轻松搞定复杂文档解析与业务验证

2025年,PaddleOCR发布了PP-OCRv5和PP-StructureV3等多个重要版本。新模型PaddleOCR-VL在复杂文档解析上达到了全球最高精度,受到广泛关注。官网API服务升级,调用额度提升至每日3000页,并支持在线申请更多额度,优化了用户体验。新增的辅助内容解析功能使用户能灵活控制解析结果,满足不同需求。PaddleOCR致力于为开发者提供可靠的基础能力,推动大模型应用落地。

PaddleOCR官网升级:文心最强衍生模型PaddleOCR-VL体验升级,轻松搞定复杂文档解析与业务验证

百度大脑
百度大脑 · 2025-12-24T12:10:38Z
KnowFlow × PaddleOCR-VL:文档领域深度集成,为企业快速构建大模型的数据治理根基

KnowFlow与百度飞桨PaddleOCR-VL合作,推出新方案,整合企业级知识库与视觉语言模型,提升文档解析与知识构建能力。PaddleOCR-VL在多语言识别和复杂版面解析上表现优异,支持企业处理多类型文档,增强知识库的准确性与可信度,推动智能技术在产业中的应用。

KnowFlow × PaddleOCR-VL:文档领域深度集成,为企业快速构建大模型的数据治理根基

百度大脑
百度大脑 · 2025-11-25T12:12:29Z
Parsr - 一款开源文档解析工具链,能够转换PDF、图像和办公文档等格式...

Parsr是AXA开发的开源文档解析工具,支持PDF、图像、DOCX等格式,能够将文档转换为结构化输出(如JSON、Markdown)。它专注于文档清理和层次重建,提取文本、段落、表格和元数据,适用于搜索归档和发票提取等场景,并支持本地和私有环境部署。

Parsr - 一款开源文档解析工具链,能够转换PDF、图像和办公文档等格式...

云原生
云原生 · 2025-11-24T10:55:49Z
飞桨星河社区月度报告(2025年10月)

PaddleOCR官网上线,集成文档智能解析方案,支持多格式上传与输出。新增博客功能,提升用户互动体验。社区更新了140+数据集,涵盖多领域应用,并推出多项课程与活动,促进AI技术交流与实践。同时,启动星河超级个体Hackathon赛事,鼓励开发者构建可落地产品原型。

飞桨星河社区月度报告(2025年10月)

百度大脑
百度大脑 · 2025-11-14T12:06:27Z
PaddleOCR-VL训练揭秘:ERNIEKit成就小参数大能量的SOTA模型

文心4.5衍生模型PaddleOCR-VL专为文档解析设计,结合动态分辨率视觉编码器与ERNIE语言模型,具备高效识别能力。用户可通过ERNIEKit工具快速微调模型,优化训练流程,提升效率。该模型支持多语言及复杂文档解析,性能优于现有模型,推动文档数字化进程。

PaddleOCR-VL训练揭秘:ERNIEKit成就小参数大能量的SOTA模型

百度大脑
百度大脑 · 2025-10-28T11:59:09Z
PaddleOCR官网正式上线——文档解析的事,交给PaddleOCR

PaddleOCR官网正式上线,提供PaddleOCR-VL等三大文档智能方案,支持多语言文档解析。用户可在线体验OCR技术,支持多种格式上传,识别结果可实时修正并导出,旨在普及AI文档解析工具,助力开发者快速集成与部署。

PaddleOCR官网正式上线——文档解析的事,交给PaddleOCR

百度大脑
百度大脑 · 2025-10-24T12:04:34Z
企业文档数字化破局,PaddleOCR-VL如何驾驭复杂版面,实现真正端到端文档理解?

PaddleOCR-VL在复杂文档解析中表现出色,能够处理多语言文本、表格和公式,确保阅读顺序和结构完整性。其创新的两阶段架构和动态分辨率处理,使其在商业、教育和金融等领域得到广泛应用,提升了文档数字化效率,标志着文档处理技术的进步。

企业文档数字化破局,PaddleOCR-VL如何驾驭复杂版面,实现真正端到端文档理解?

百度大脑
百度大脑 · 2025-10-22T11:41:09Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码