小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
工业 OCR 实战:C# + Halcon 打造参数可调的印刷字符识别系统

本文介绍了一款基于Halcon和WinForms的本地OCR系统,专为工业场景设计,支持多种图像格式和动态参数调整,识别准确率高达95%。该系统具有可调、可控和可替换的特点,适合自动化生产线和质量检测应用。

工业 OCR 实战:C# + Halcon 打造参数可调的印刷字符识别系统

dotNET跨平台
dotNET跨平台 · 2026-01-29T00:02:52Z
百度在Hugging Face发布PP-OCRv5,光学字符识别基准测试中超越VLMs

百度在Hugging Face发布了PP-OCRv5,这是一种高效的光学字符识别模型,专注于文本识别,支持多语言,适合边缘部署。尽管对其多语言能力有疑虑,但在手写和印刷文本的基准测试中表现优异。

百度在Hugging Face发布PP-OCRv5,光学字符识别基准测试中超越VLMs

InfoQ
InfoQ · 2025-09-25T17:45:00Z
使用winform开发的工控领域视觉检测

OCVSoftware是一款专为工控场景设计的视觉检测工具,能够高效解决字符识别、条码解析和缺陷检测等问题。其核心技术包括深度学习和图像处理,支持多线程和模块化设计,适用于多个行业,提升生产效率。

使用winform开发的工控领域视觉检测

dotNET跨平台
dotNET跨平台 · 2025-09-22T00:01:43Z

OCVSoftware是一款专为工控领域设计的视觉检测软件,具备字符识别、条码扫描和缺陷检测功能,采用先进的图像处理和机器学习技术,提升生产效率和产品质量,广泛应用于电子制造、物流和汽车制造等行业。

WinForm 框架下的工控领域视觉检测

dotNET跨平台
dotNET跨平台 · 2025-09-06T00:00:52Z

本研究构建了包含一百万张标注图像的PsOCR数据集,解决了普什图语OCR中的数据稀缺和文字形态问题。结果表明,Gemini模型表现最佳,Qwen-7B在开源模型中领先,为普什图语OCR研究奠定了基础。

PsOCR:低资源普什图语光学字符识别的大型多模态模型评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z
Mistral OCR:文档理解与人工智能驱动的光学字符识别的未来

Mistral OCR是一款先进的文档理解和光学字符识别工具,能够高效提取复杂文档中的结构化信息,支持多语言和多模态处理,准确性优于其他主流OCR模型,适用于科学研究、文化保护和企业文档自动化等领域。

Mistral OCR:文档理解与人工智能驱动的光学字符识别的未来

DEV Community
DEV Community · 2025-03-11T04:14:18Z

本研究解决了阿拉伯语光学字符识别(OCR)领域的评估体系不足,提出了KITAB-Bench基准,包含8809个样本,覆盖多达9个主要领域及36个子领域。研究发现,现代视觉语言模型在字符错误率方面较传统OCR方法提高了60%的性能,为阿拉伯文档分析提供了一个系统的评估框架,促进该领域的发展。

KITAB-Bench:阿拉伯语光学字符识别和文档理解的综合多领域基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z
如何在C#中使用光学字符识别(OCR)技术准确识别车牌号码和文本,并在Windows窗体中展示识别结果?

本文讨论了如何在C#中使用光学字符识别(OCR)技术准确识别车牌号码和文本,并在Windows窗体中展示识别结果。

如何在C#中使用光学字符识别(OCR)技术准确识别车牌号码和文本,并在Windows窗体中展示识别结果?

DEV Community
DEV Community · 2025-01-31T15:49:52Z
查找Unicode(Flow Launcher)

该文章介绍了一款Flow Launcher插件,用户可以通过描述或代码点查找Unicode字符和表情符号。插件功能包括查看字符详情、设置表情符号以及在字符串中识别字符。

查找Unicode(Flow Launcher)

1A23 Studio
1A23 Studio · 2025-01-14T23:12:32Z

本研究针对甲骨文字符识别的专业性和人工限制,提出了调研框架,分析了主要挑战和数据集,并评估了现有方法的有效性。结果表明,结合模式识别与深度学习的自动化方法有望推动该领域的发展。

甲骨文字符识别的综合调查:挑战、基准和未来

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本文针对历史印刷媒体档案数字化过程中光学字符识别(OCR)错误的问题,提出了上下文利用的OCR校正方法(CLOCR-C),利用基于变换器的语言模型改进OCR质量。研究表明,一些语言模型显著降低了错误率,并通过提供社会文化背景提升了校正效果,展示了CLOCR-C在提升现有数字档案质量方面的潜在影响。

上下文利用的光学字符识别校正与预训练语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-30T00:00:00Z

通过融合目标检测和字符识别模型,提升细粒度图像理解能力。多模态大型语言模型在视觉任务中表现优秀,超过先进模型。发布代码以探索多模态对话能力应用。

多模态大语言模型中的视觉表示法则

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-29T00:00:00Z

本文全面审查了阿拉伯OCR的应用、方法和挑战,并确定了研究空白和未来发展方向。研究结果为阿拉伯OCR的研究人员和实践者提供了宝贵见解,促进了该领域的进步。

数字乌尔都文本的单词光学字符识别使用变换自回归序列建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

本文强调了使用跨编码器训练数据对CNN进行历史抄写员识别的重要性。实验结果显示,预处理中的屏蔽灰度图像可以提高分类结果的F1分数。AlexNet网络在行级别和页级别上获得了高F1分数。通过实施拒绝选项可以进一步改善CNN输出。使用大规模开源数据集展示了自动复现古文献学决策的能力,为古文献学家提供了获取未标记材料见解的新方法。

HABD:侯马联盟书古代手写字符识别数据库

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-26T00:00:00Z

本研究探讨了合成数据在后光学字符识别领域的应用,通过实验评估数据量、增强和合成数据生成方法对模型性能的影响。引入了一种新的算法,利用计算机视觉特征检测算法计算字形相似度,用于构建后光学字符识别合成数据。实验证明像ByT5这样的模型可以显著降低字符错误率(CER),而合成数据生成方法在低资源语言方面表现出优势。

推进后期光学字符识别校正:合成数据的比较研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-05T00:00:00Z

本研究旨在通过对预训练基础 OCR 模型进行有效的参数微调,在各种下游任务中展示出卓越的性能。我们提出了一种基于预训练 OCR Transformer 的参数高效混合文本识别方法,即 DLoRA-TrOCR。该方法将 DoRA 嵌入图像编码器和 LoRA 嵌入文本解码器的内部结构,使得下游任务的参数微调更加高效。实验结果表明,与类似的参数调整方法相比,我们的模型 DLoRA-TrOCR...

DLoRA-TrOCR:基于 Transformer 的混合文本模式光学字符识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-19T00:00:00Z

本文全面审查了阿拉伯OCR的应用、方法和挑战,并确定了研究空白和未来发展方向。这为阿拉伯OCR的研究人员和实践者提供了宝贵的见解,促进了该领域的进步。

利用可用的光学字符识别引擎增强处理旧的库尔德出版物

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-09T00:00:00Z

通过融合目标检测和字符识别模型,研究改善细粒度图像理解能力。实验结果显示,改进后的多模态大型语言模型在视觉任务中表现优秀,取得了重大进展。希望进一步探索其在多模态对话方面的应用。

VisionGPT: 基于 LLM 辅助的实时异常检测用于安全视觉导航

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-19T00:00:00Z

Cloudflare宣布了两项对其数据丢失预防(DLP)服务的增强:支持光学字符识别(OCR)和预定义源代码检测。通过OCR,客户可以识别和分类图像或扫描文档中的敏感信息。预定义源代码检测允许组织扫描内联流量以查找常见的代码语言,并阻止HTTP请求以防止数据泄漏。这些功能是Cloudflare的一套服务的一部分,帮助保护Web、SaaS和私有应用程序中的数据。

宣布两项备受期待的DLP增强功能:光学字符识别(OCR)和源代码检测

The Cloudflare Blog
The Cloudflare Blog · 2024-03-05T14:00:27Z

介绍了TextOCR系统,可检测和识别任意形状的场景文本。使用PixelM4C模型在TextVQA数据集上取得了最新性能水平。

LOCR:基于位置引导的光学字符识别 Transformer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-04T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码