小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate

云知声推出Unisound U1-OCR,标志着OCR 3.0时代的到来。该模型具备高效的文档理解能力,超越传统OCR,实现从“识别文字”到“理解文档”的转变,适应复杂场景,提高文档处理效率。

云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代

量子位
量子位 · 2026-02-26T08:16:16Z
让 Snipaste 使用微信 OCR(Linux)

我有一个用 Go 编写的 OCR 代理程序,计划在 Linux 上使用。决定用 shell 脚本封装 `test_cli`,处理输入输出,过滤无关信息,仅保留 OCR 识别的文本,并将调试信息输出到标准错误。

让 Snipaste 使用微信 OCR(Linux)

闪星空间
闪星空间 · 2026-02-24T14:20:00Z
Karakeep 0.31.0 更新:阅读进度同步、LLM OCR、更强导入与移动端高亮

Karakeep 0.31.0 更新了跨设备阅读进度同步、改进导入流程、支持拖拽整理书签和移动端高亮功能,并修复了爬虫相关的安全问题,建议用户升级。

Karakeep 0.31.0 更新:阅读进度同步、LLM OCR、更强导入与移动端高亮

小众软件
小众软件 · 2026-02-23T11:52:58Z
OCR教程汇总丨DeepSeek/百度飞桨/华中科大等开源创新技术,实现OCR高精度、本地化部署

本文系统梳理了多种高质量OCR开源模型,介绍了OCR技术的发展及其在金融、医疗和电商等领域的应用。新一代模型如GLM-OCR和PaddleOCR-VL-1.5具备高精度、多语言识别和复杂文档解析能力,推动OCR从文字提取工具向结构化信息理解引擎转变。

OCR教程汇总丨DeepSeek/百度飞桨/华中科大等开源创新技术,实现OCR高精度、本地化部署

HyperAI超神经
HyperAI超神经 · 2026-02-22T03:10:21Z

一款能够定时截取屏幕图像,并识别指定区域文字的程序成为了许多领域迫切需要解决的问题。通过定时截屏并应用光学字符识别(OCR)技术,程序可以准确地读取屏幕上的特定区域内容,并将其转换为可编辑和分析的数字文本。基于屏幕截图OCR的数据采集程序,以其独特的设计理念和技术实现,为用户提供了一种高效、便捷的方式来获取屏幕上的文本信息。对于具体的坐标配置,则提供了简便的方法,允许用户直接在画图程序中确定...

C# 实现桌面数据自动采集:截屏 + OCR + 实时转发

dotNET跨平台
dotNET跨平台 · 2026-02-17T23:56:04Z

这个仅 10 亿参数的端到端视觉-语言模型,在权威基准 OlmOCR-Bench 上实现了新的 SOTA,性能超越此前最佳的 90 亿参数模型,同时体积缩小 9 倍、推理速度提升数倍。LightOnOCR-2-1B 用一个统一模型直接从像素生成结构化的有序文本和图像边界框,通过集成预训练组件、高质量的蒸馏数据以及 RLVR...

LightOnOCR-2-1B:基于 RLVR 训练实现高精度端到端 OCR;Google Streetview 国家街景图像:基于世界级地理映射技术的全景图像开源库

HyperAI超神经
HyperAI超神经 · 2026-02-09T06:31:16Z

通过网盘分享的文件:lw.OnnxRuntime.OCRService_release.tar.gz 链接: https://pan.baidu.com/s/11Z2Xe-rxf9IC3heuT4h_zg?pwd=bwa4 提取码: bwa4。Ubuntu OnnxRuntime 免费版GPU OCR识别服务。2、进入目录、运行程序。

Ubuntu  OnnxRuntime 免费版GPU OCR识别服务

dotNET跨平台
dotNET跨平台 · 2026-02-07T00:02:26Z

通过新增对 PP-OCR v4/v5 的完整支持,以及提供 OpenVINO、TensorRT、ONNX Runtime 等多种推理引擎的统一接口,我们为 .NET 开发者提供了一套强大而灵活的 OCR 部署解决方案。最近,我们完成了 PP-OCR v4/v5 的支持更新,给 .NET 开发者送上了一份完整的 OCR...

DeploySharp 震撼升级!支持PP-OCR 全系列模型极速推理,开源免费多平台支持,RTX 3060 上狂飙至 23ms!我的项目我做主,从此加速不求人

dotNET跨平台
dotNET跨平台 · 2026-02-05T23:42:45Z

本文推荐基于百度飞桨的 PaddleOCR 引擎,开发的一个轻量、易用且支持半自动标注的桌面平台,让开发和数据标注人员能够高效地完成 OCR...

C# 轻量、易用、可本地部署的 OCR 标注工具

dotNET跨平台
dotNET跨平台 · 2026-02-04T23:46:07Z

对比DeepSeek-OCR,少数地方有进步,但整体可用性降低。

尝试使用 DeepSeek-OCR 2

如鱼饮水
如鱼饮水 · 2026-02-04T07:25:29Z

「DeepSeek-OCR 2:视觉因果流」已上线至 HyperAI超神经官网的「教程」板块,仅需上传图片,即可得到精准的 OCR 文本解析,快来试试吧~

在线教程|DeepSeek-OCR 2公式/表格解析同步改善,以低视觉token成本实现近4%的性能跃迁

HyperAI超神经
HyperAI超神经 · 2026-02-04T06:31:58Z

通过网盘分享的文件:lw.OnnxRuntime.PPOCRSharp_dml_test.rar 链接: https://pan.baidu.com/s/188r8psLROddGQrCxglyBIQ?我们的OCR推理库正是基于OnnxRuntime的DML执行提供程序构建,这意味着只要你的Windows机器有DirectX...

免费GPU版OCR推理库来了!不挑卡的OnnxRuntime DML方案来了

dotNET跨平台
dotNET跨平台 · 2026-02-03T23:55:32Z

百度开源新一代OCR模型PaddleOCR-VL-1.5,实现全球首个“异形框定位”能力,精度达到94.5%。该模型在复杂文档解析中表现优异,支持多语种识别,推动OCR技术应用落地。

性能超越DeepSeek-OCR2,百度发布并开源新一代SOTA OCR模型

量子位
量子位 · 2026-01-30T06:10:24Z

近期,我们完成了 PaddleOCR 模型的支持更新,为 .NET 开发者提供了一套完整的 OCR 解决方案。本文介绍如何通过 DeploySharp 框架在 .NET 环境下部署 PaddleOCR 模型,支持 OpenVINO、TensorRT、ONNX Runtime...

使用 JYPPX.DeploySharp 高效部署 PaddleOCR,解锁多种高性能 OCR 文字识别方案

dotNET跨平台
dotNET跨平台 · 2026-01-30T00:03:58Z

对于需要稳定识别固定格式印刷字符的项目(如仪表读数、产品编码、包装标签),这套系统能显著缩短开发周期,提升识别稳定性。虽然市面上已有不少 OCR 工具,但在特定领域(如高噪声、低对比度、固定字体)下,通用方案往往效果不佳。:OCR 核心逻辑完全由 Halcon 脚本定义,若需更换分类器(如从 DotPrint 切换为...

工业 OCR 实战:C# + Halcon 打造参数可调的印刷字符识别系统

dotNET跨平台
dotNET跨平台 · 2026-01-29T00:02:52Z

DeepSeek发布了新OCR模型DeepSeek-OCR 2,采用轻量化Qwen2-0.5B模型,性能接近Gemini-3 Pro。该模型通过DeepEncoder V2实现视觉标记智能重排,提升PDF转Markdown的准确性,基于OmniDocBench v1.5测试显示性能提升3.73%。

DeepSeek开源全新OCR模型!弃用CLIP改用Qwen轻量小模型,性能媲美Gemini-3 Pro

量子位
量子位 · 2026-01-28T06:16:01Z
DeepSeek-OCR 2大模型开源,重塑文档AI的认知逻辑

深度求索团队发布的DeepSeek-OCR 2模型在文档理解能力上取得了91.09%的得分。其核心创新“视觉因果流”提升了模型对复杂文档结构的理解,增强了处理效率和准确性,适用于多种文档类型,为未来多模态人工智能提供了新方向。

DeepSeek-OCR 2大模型开源,重塑文档AI的认知逻辑

TechWeb 全站精华
TechWeb 全站精华 · 2026-01-27T09:17:52Z

刚刚,DeepSeek又探索新架构了,开源OCR 2

机器之心
机器之心 · 2026-01-27T06:12:05Z
Mistral发布OCR 3,提升手写和结构化文档的识别准确性

Mistral发布了Mistral OCR 3,显著提升了对手写、表单和复杂表格文档的识别准确性,整体胜率达到74%。该模型能够提取文本和嵌入图像,输出为Markdown格式,适合结构化数据需求,用户反馈速度快,语言覆盖广,适用于多种业务场景。

Mistral发布OCR 3,提升手写和结构化文档的识别准确性

InfoQ
InfoQ · 2026-01-15T09:00:00Z

Snipaste 现已支持 OCR 功能,能够识别图片中的文字。通过集成 Tesseract 和微信 OCR,用户可以实现高效的文字识别。开发中使用 Golang 简化操作,用户需下载并配置相关文件,识别速度快且准确。

让 Snipaste 使用微信 OCR

闪星空间
闪星空间 · 2026-01-12T14:33:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码