小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
96.33% 新SOTA!PaddleOCR-VL-1.6 发布,大模型时代的数据基座再升级

PaddleOCR-VL-1.6正式发布,基于1.5版本进行了优化,文档解析性能显著提升,OmniDocBench v1.6指标突破96.3%。新版本支持异形框定位,增强了表格、古籍及生僻字的识别能力,模型结构保持一致,用户可快速适配。此外,PaddleOCR-VL系列与多家硬件及云平台合作,推动文档智能化转型。

96.33% 新SOTA!PaddleOCR-VL-1.6 发布,大模型时代的数据基座再升级

百度大脑
百度大脑 · 2026-05-28T12:31:56Z
CVHub x PaddleOCR:X-AnyLabeling 升级 OCR 实战工作流,服务开发者数据闭环

PaddleOCR与CVHub合作推出X-AnyLabeling工具,支持PaddleOCR-VL-1.5模型,提升复杂文档的解析、复核和结构化导出能力。该工具简化了OCR数据准备流程,支持多任务解析,降低人工标注成本,助力开发者高效完成文档处理和数据沉淀。X-AnyLabeling被指定为PaddleOCR全球衍生模型挑战赛的官方标注平台。

CVHub x PaddleOCR:X-AnyLabeling 升级 OCR 实战工作流,服务开发者数据闭环

百度大脑
百度大脑 · 2026-05-13T11:54:39Z
文心飞桨 x OceanBase深圳站:携手硬件伙伴打通Agent生产落地链路

4月25日,百度文心飞桨与OceanBase等企业在深圳举办技术活动,探讨AI Agent的演进及其在企业环境中的应用。专家分享了数据底座、文档资产化与智能硬件的结合。百度飞桨发布PaddleOCR 3.5,提升文档解析能力,助力企业将文档转化为知识资产,推动AI技术在真实场景中的落地。

文心飞桨 x OceanBase深圳站:携手硬件伙伴打通Agent生产落地链路

百度大脑
百度大脑 · 2026-04-29T12:07:19Z
PaddleOCR 3.5 发布:Web 端直用、文档一键转 Markdown,生态交互新体验

PaddleOCR 3.5正式发布,新增PaddleOCR.js,支持浏览器端OCR功能,简化开发者体验。可将文档解析结果导出为Word和Markdown格式,并支持多种文档类型。此版本整合了Transformers推理引擎,提升了OCR能力的灵活性和兼容性,旨在降低AI应用开发门槛,推动OCR技术发展。

PaddleOCR 3.5 发布:Web 端直用、文档一键转 Markdown,生态交互新体验

百度大脑
百度大脑 · 2026-04-21T12:39:26Z
技术深度揭秘|云知声U1-OCR架构升级 + API 开放,重构 OCR 3.0 时代

云知声发布了工业级文档智能基础大模型Unisound U1-OCR,标志着OCR 3.0时代的到来。该模型具备高效部署和强适配能力,支持金融、医疗等行业的复杂文档解析,提升了文档结构理解和阅读顺序恢复能力,解决了传统OCR的局限性,推动行业数字化转型。

技术深度揭秘|云知声U1-OCR架构升级 + API 开放,重构 OCR 3.0 时代

量子位
量子位 · 2026-04-21T04:50:16Z
飞桨星河社区月度报告(2026年3月)

PaddleOCR及其社区进行了多项功能和资源更新,包括提升文档解析体验、新增模型、丰富项目和数据集资源。推出了技术实战专栏,帮助开发者解决实际问题。同时,PaddleOCR OCEAN生态联盟成立,促进了社区的生态共建与技术发展。

飞桨星河社区月度报告(2026年3月)

百度大脑
百度大脑 · 2026-04-07T11:36:35Z
在线教程丨华中科大与小红书 hi lab开源dots.mocr,SOTA级OCR模型完美还原文档结构,图形也能转 SVG

华中科技大学与小红书hi lab联合开源了dots.mocr,旨在解决传统OCR在复杂文档解析中的不足。该工具能够将文字、图表等视觉元素解析为结构化数据,并转换为可编辑的SVG代码,提升文档理解和自动化处理能力。HyperAI官网已上线相关教程,用户可在线体验。

在线教程丨华中科大与小红书 hi lab开源dots.mocr,SOTA级OCR模型完美还原文档结构,图形也能转 SVG

HyperAI超神经
HyperAI超神经 · 2026-04-01T11:28:09Z
手把手部署教学+官方skills,在星河社区免费玩转小龙虾!

OpenClaw在开发者中越来越受欢迎,但许多人在使用时遇到问题。星河社区提供免费的CPU云端环境,帮助用户快速部署OpenClaw。文章介绍了如何配置和安装三个核心技能,使OpenClaw从“玩具”转变为“工具”,以解决文档解析和文字识别等实际问题。

手把手部署教学+官方skills,在星河社区免费玩转小龙虾!

百度大脑
百度大脑 · 2026-03-23T12:31:10Z
01Agent×百度AI:终结“AI生图无法修改”的难题,让每张图都真正可编辑!

01Agent是一款智能内容创作工具,结合PaddleOCR-VL-1.5和ERNIE-5.0,支持高效解析文档和二次创作。用户可上传图片和PDF,系统自动提取结构化信息,提升创作效率。通过识别与编辑图像元素,用户可以灵活修改内容,实现持续生产与复用。

01Agent×百度AI:终结“AI生图无法修改”的难题,让每张图都真正可编辑!

百度大脑
百度大脑 · 2026-02-12T12:35:54Z
OpenClaw × PaddleOCR:开箱即用!将文档解析 Skill 能力注入你的 Agent 工具

OpenClaw推出了PaddleOCR文档解析技能,支持多种文档格式和语言,自动分析文档结构并输出结构化数据,降低集成成本,提高开发效率。PaddleOCR从独立服务转变为可组合的标准化节点,助力知识库构建和自动化处理。

OpenClaw × PaddleOCR:开箱即用!将文档解析 Skill 能力注入你的 Agent 工具

百度大脑
百度大脑 · 2026-02-10T10:55:58Z
RAGFlow x PaddleOCR:联动知名开源伙伴,打造端到端高精度文档解析新范式

RAGFlow是一款开源RAG引擎,集成了PaddleOCR-VL-1.5,提升了文档解析能力。新版本增强了复杂文档的结构化转换,支持多边形元素定位和跨页识别,确保高质量的语义切分和引用追溯,提高了文档型RAG的可用性与可信度,助力企业级知识管理。

RAGFlow x PaddleOCR:联动知名开源伙伴,打造端到端高精度文档解析新范式

百度大脑
百度大脑 · 2026-02-09T09:40:52Z
Pathway × PaddleOCR:握手知名开源框架,打通“动态文档”到实时 RAG 的数据入口

PaddleOCR与Pathway深度集成,实现实时文档解析。通过PaddleOCRParser,Pathway高效处理动态文档,提供结构化数据,支持实时更新与索引,降低运维成本,提升系统可靠性,满足企业文档数字化需求。

Pathway × PaddleOCR:握手知名开源框架,打通“动态文档”到实时 RAG 的数据入口

百度大脑
百度大脑 · 2026-02-06T13:25:55Z
Haystack × PaddleOCR:海外开源伙伴+1!构建面向 RAG 与 Agent 的统一文档解析入口

PaddleOCR与Haystack深度集成,提升了文档解析能力,支持复杂文档的结构化处理。PaddleOCR-VL-1.5可直接接入Haystack Pipeline,实现高精度解析,优化RAG和Agent工作流,满足企业级应用需求。此集成简化了文档入库流程,提高了数据可追溯性和检索准确性,推动了AI在文档密集场景中的应用。

Haystack × PaddleOCR:海外开源伙伴+1!构建面向 RAG 与 Agent 的统一文档解析入口

百度大脑
百度大脑 · 2026-02-04T13:10:46Z

百度开源新一代OCR模型PaddleOCR-VL-1.5,实现全球首个“异形框定位”能力,精度达到94.5%。该模型在复杂文档解析中表现优异,支持多语种识别,推动OCR技术应用落地。

性能超越DeepSeek-OCR2,百度发布并开源新一代SOTA OCR模型

量子位
量子位 · 2026-01-30T06:10:24Z
PaddleOCR-VL-1.5发布问鼎双榜,0.9B小钢炮攻克“曲面”文档!

PaddleOCR于2025年推出PaddleOCR-VL-1.5,具备94.5%精度,支持异形框定位,提升文本行和印章识别能力。该模型在复杂场景中表现优异,已开源,用户可通过官网和API使用。新版本优化了推理速度,支持多语种和跨页表格合并,旨在提升文档解析的准确性和效率。

PaddleOCR-VL-1.5发布问鼎双榜,0.9B小钢炮攻克“曲面”文档!

百度大脑
百度大脑 · 2026-01-29T12:16:02Z
七大开源OCR模型

本文介绍了七种可本地运行的光学字符识别(OCR)模型,如olmOCR-2、PaddleOCR v5和OCRFlux 3B,能够高效将文档、表格和图形转换为准确的Markdown文本,支持多语言、跨页合并和视频处理,适用于多种文档解析需求。

七大开源OCR模型

KDnuggets
KDnuggets · 2025-12-24T13:00:41Z
PaddleOCR官网升级:文心最强衍生模型PaddleOCR-VL体验升级,轻松搞定复杂文档解析与业务验证

2025年,PaddleOCR发布了PP-OCRv5和PP-StructureV3等多个重要版本。新模型PaddleOCR-VL在复杂文档解析上达到了全球最高精度,受到广泛关注。官网API服务升级,调用额度提升至每日3000页,并支持在线申请更多额度,优化了用户体验。新增的辅助内容解析功能使用户能灵活控制解析结果,满足不同需求。PaddleOCR致力于为开发者提供可靠的基础能力,推动大模型应用落地。

PaddleOCR官网升级:文心最强衍生模型PaddleOCR-VL体验升级,轻松搞定复杂文档解析与业务验证

百度大脑
百度大脑 · 2025-12-24T12:10:38Z
KnowFlow × PaddleOCR-VL:文档领域深度集成,为企业快速构建大模型的数据治理根基

KnowFlow与百度飞桨PaddleOCR-VL合作,推出新方案,整合企业级知识库与视觉语言模型,提升文档解析与知识构建能力。PaddleOCR-VL在多语言识别和复杂版面解析上表现优异,支持企业处理多类型文档,增强知识库的准确性与可信度,推动智能技术在产业中的应用。

KnowFlow × PaddleOCR-VL:文档领域深度集成,为企业快速构建大模型的数据治理根基

百度大脑
百度大脑 · 2025-11-25T12:12:29Z
Parsr - 一款开源文档解析工具链,能够转换PDF、图像和办公文档等格式...

Parsr是AXA开发的开源文档解析工具,支持PDF、图像、DOCX等格式,能够将文档转换为结构化输出(如JSON、Markdown)。它专注于文档清理和层次重建,提取文本、段落、表格和元数据,适用于搜索归档和发票提取等场景,并支持本地和私有环境部署。

Parsr - 一款开源文档解析工具链,能够转换PDF、图像和办公文档等格式...

云原生
云原生 · 2025-11-24T10:55:49Z
飞桨星河社区月度报告(2025年10月)

PaddleOCR官网上线,集成文档智能解析方案,支持多格式上传与输出。新增博客功能,提升用户互动体验。社区更新了140+数据集,涵盖多领域应用,并推出多项课程与活动,促进AI技术交流与实践。同时,启动星河超级个体Hackathon赛事,鼓励开发者构建可落地产品原型。

飞桨星河社区月度报告(2025年10月)

百度大脑
百度大脑 · 2025-11-14T12:06:27Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码