小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
鹰迅OCR:几十种功能集成工具,证件、发票、快递单、扫描件一键提取,省掉手动录入

鹰迅OCR是一款智能文字识别工具,支持批量处理,识别精准且免费。它提供文档处理、证件识别、车辆物流识别和财务票据识别等功能,能够有效提取信息到Excel,简化办公流程,提升工作效率。

鹰迅OCR:几十种功能集成工具,证件、发票、快递单、扫描件一键提取,省掉手动录入

小众软件
小众软件 · 2026-04-21T09:07:09Z
技术深度揭秘|云知声U1-OCR架构升级 + API 开放,重构 OCR 3.0 时代

云知声发布了工业级文档智能基础大模型Unisound U1-OCR,标志着OCR 3.0时代的到来。该模型具备高效部署和强适配能力,支持金融、医疗等行业的复杂文档解析,提升了文档结构理解和阅读顺序恢复能力,解决了传统OCR的局限性,推动行业数字化转型。

技术深度揭秘|云知声U1-OCR架构升级 + API 开放,重构 OCR 3.0 时代

量子位
量子位 · 2026-04-21T04:50:16Z

谷歌推出了适用于Windows 10/11的桌面应用Google App,用户可以通过快捷搜索框与Gemini AI对话。该应用支持OCR识别图片内容、上传文件处理,并能访问谷歌云端硬盘中的文件。用户还可以使用快捷键快速获取AI答案,并利用内置的Google Lens和屏幕共享功能提问。

谷歌推出桌面应用帮助用户快速使用Gemini AI提问/图像识别/查找内容

蓝点网
蓝点网 · 2026-04-15T08:52:34Z
DeploySharp 使用 ONNX Runtime 部署 PP-OCR v4/v5 教程

本文介绍了如何使用 DeploySharp 框架和 ONNX Runtime 部署 PP-OCR v4/v5 模型,涵盖 CPU、CUDA、DML 和 TensorRT 等多种推理方式。文章详细说明了环境准备、模型配置、推理实现及性能对比,并提供代码示例和优化建议,以帮助开发者高效进行 OCR 部署。

DeploySharp 使用 ONNX Runtime 部署 PP-OCR v4/v5 教程

dotNET跨平台
dotNET跨平台 · 2026-04-13T23:57:57Z
体验下微软开源的Markdown转换工具Markitdown

微软开源的Markdown转换工具Markitdown可以将多种文件格式转换为Markdown,便于大模型分析。该工具支持命令行操作和OCR插件,能够提取嵌入图像中的文本,但在表格和非文本内容的转换效果有限。

体验下微软开源的Markdown转换工具Markitdown

Nicksxs's Blog
Nicksxs's Blog · 2026-04-05T14:11:22Z
告别 PDF 乱码错版,DeepSeek OCR 驱动,手机就能用:将扫描版 PDF 转换为 EPUB 电子书

小墨阅读器基于DeepSeek-OCR技术,解决手机PDF阅读难题,支持PDF转换为EPUB和Markdown,精准识别复杂内容,提供翻译和语音功能,适用于iOS和桌面端。

告别 PDF 乱码错版,DeepSeek OCR 驱动,手机就能用:将扫描版 PDF 转换为 EPUB 电子书

小众软件
小众软件 · 2026-04-02T11:36:09Z
Translumo:一款实时屏幕翻译工具,支持多语言和多OCR引擎

Translumo是一款实时屏幕翻译工具,支持多语言和高精度OCR,适用于游戏和视频等内容的快速翻译。它开源、完全本地化,使用简便,适合多种应用场景。

Translumo:一款实时屏幕翻译工具,支持多语言和多OCR引擎

极道
极道 · 2026-04-01T12:37:00Z
在线教程丨华中科大与小红书 hi lab开源dots.mocr,SOTA级OCR模型完美还原文档结构,图形也能转 SVG

华中科技大学与小红书hi lab联合开源了dots.mocr,旨在解决传统OCR在复杂文档解析中的不足。该工具能够将文字、图表等视觉元素解析为结构化数据,并转换为可编辑的SVG代码,提升文档理解和自动化处理能力。HyperAI官网已上线相关教程,用户可在线体验。

在线教程丨华中科大与小红书 hi lab开源dots.mocr,SOTA级OCR模型完美还原文档结构,图形也能转 SVG

HyperAI超神经
HyperAI超神经 · 2026-04-01T11:28:09Z
全球OCR新王来自中国开源!GitHub狂揽73300+Star

百度的PaddleOCR在GitHub上获得73300+星标,超越谷歌的Tesseract OCR,成为全球OCR项目的领军者。这标志着中国在OCR领域的首次领先。PaddleOCR依托深度学习和文心大模型,实现了快速增长,用户遍及160个国家,支持110种语言,推动了OCR技术的广泛应用。

全球OCR新王来自中国开源!GitHub狂揽73300+Star

量子位
量子位 · 2026-03-30T14:15:44Z
站在全球之巅,共建生态之海:PaddleOCR OCEAN生态联盟来了

PaddleOCR在GitHub上的Star数超过Tesseract,成为全球第一的OCR开源项目。同时,PaddleOCR OCEAN生态联盟成立,旨在推动OCR技术的应用与生态繁荣,吸引全球开发者与企业合作。

站在全球之巅,共建生态之海:PaddleOCR OCEAN生态联盟来了

百度大脑
百度大脑 · 2026-03-30T07:45:34Z
PaddleOCR 全球衍生模型挑战赛启动!7万元奖金池,等你来“识“破长尾难题

第十届飞桨黑客马拉松推出「PaddleOCR全球衍生模型挑战赛」,面向全球开发者。参赛者可自定义赛题,微调模型,争夺总额7万元的奖金。比赛鼓励解决稀缺场景的OCR难题,如小语种识别和医疗处方。优秀作品将获得展示机会和指导,参赛者需自备算力。

PaddleOCR 全球衍生模型挑战赛启动!7万元奖金池,等你来“识“破长尾难题

百度大脑
百度大脑 · 2026-03-27T12:05:38Z
PaddleOCR 全球衍生模型挑战赛启动!7万元奖金池,等你来“识“破长尾难题

第十届飞桨黑客马拉松推出「PaddleOCR全球衍生模型挑战赛」,面向全球开发者。参赛者可自定义赛题,微调模型,争夺总额7万元的奖金。比赛鼓励解决小语种识别和医疗处方等稀缺场景的OCR难题。优秀作品将获得展示机会和指导,参赛者需自备算力。

PaddleOCR 全球衍生模型挑战赛启动!7万元奖金池,等你来“识“破长尾难题

百度大脑
百度大脑 · 2026-03-27T12:05:38Z

Kreuzberg v4.5 更新发布,增强了文档结构理解能力,集成了 Docling 模型,性能提升显著,处理速度提高了 2.8 倍,支持多种文档元素和 OCR 功能。

【Rust日报】2026-03-23 Kreuzberg: 一个开源(MIT 许可)的文档智能框架

Rust.cc
Rust.cc · 2026-03-27T06:36:50Z
OpenClaw 让 AI 开始“自己干活”,而我发现最先被接管的是 PDF 处理

OpenClaw 是一种新兴的 AI 助手工具,能够自动执行文档处理等任务。UPDF 等工具已实现高亮、编辑、格式转换和 OCR 识别等功能,简化了文件处理。AI 正在从回答问题转向帮助用户完成具体任务。

OpenClaw 让 AI 开始“自己干活”,而我发现最先被接管的是 PDF 处理

小众软件
小众软件 · 2026-03-13T10:17:55Z

云知声推出Unisound U1-OCR,标志着OCR 3.0时代的到来。该模型具备高效的文档理解能力,超越传统OCR,实现从“识别文字”到“理解文档”的转变,适应复杂场景,提高文档处理效率。

云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代

量子位
量子位 · 2026-02-26T08:16:16Z
PaddleOCRSharp如何加载自己的模型

PaddleOCRSharp 是一个基于百度飞桨的 C# OCR 识别库,适合.NET 开发者。它支持中、英等多语言识别,并允许自定义模型以优化特定场景的识别效果。使用前需配置开发环境并确保模型格式正确,开发者可通过调整配置和编写代码快速实现 OCR 识别。

PaddleOCRSharp如何加载自己的模型

dotNET跨平台
dotNET跨平台 · 2026-02-26T00:05:48Z
让 Snipaste 使用微信 OCR(Linux)

本文介绍了如何在Linux上使用Snipaste结合微信OCR进行图像文字识别。通过编译swigger/wechat-ocr项目,作者解决了Linux环境下的OCR需求,并编写了一个shell脚本以简化操作,最终成功实现了OCR功能并整合到Snipaste中。

让 Snipaste 使用微信 OCR(Linux)

闪星空间
闪星空间 · 2026-02-24T14:20:00Z
Karakeep 0.31.0 更新:阅读进度同步、LLM OCR、更强导入与移动端高亮

Karakeep 0.31.0 更新了跨设备阅读进度同步、改进导入流程、支持拖拽整理书签和移动端高亮功能,并修复了爬虫相关的安全问题,建议用户升级。

Karakeep 0.31.0 更新:阅读进度同步、LLM OCR、更强导入与移动端高亮

小众软件
小众软件 · 2026-02-23T11:52:58Z
OCR教程汇总丨DeepSeek/百度飞桨/华中科大等开源创新技术,实现OCR高精度、本地化部署

本文系统梳理了多种高质量OCR开源模型,介绍了OCR技术的发展及其在金融、医疗和电商等领域的应用。新一代模型如GLM-OCR和PaddleOCR-VL-1.5具备高精度、多语言识别和复杂文档解析能力,推动OCR从文字提取工具向结构化信息理解引擎转变。

OCR教程汇总丨DeepSeek/百度飞桨/华中科大等开源创新技术,实现OCR高精度、本地化部署

HyperAI超神经
HyperAI超神经 · 2026-02-22T03:10:21Z
C# 实现桌面数据自动采集:截屏 + OCR + 实时转发

本文介绍了一款基于屏幕截图OCR的数据采集程序,能够定时截取特定区域的图像并识别文字,提升数据提取效率,减少人为错误。支持将识别结果保存为CSV文件或通过MQTT传输,使用.NET Framework、OpenCvSharp和Tesseract OCR技术,灵活易用。

C# 实现桌面数据自动采集:截屏 + OCR + 实时转发

dotNET跨平台
dotNET跨平台 · 2026-02-17T23:56:04Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码