小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
WPF + Halcon + YOLO 工业视觉检测的全能上位机

本文介绍了一款基于WPF的机器视觉上位机软件,旨在提升工业检测效率。该软件集成Halcon与海康视觉算法,支持深度学习模型,简化视觉系统开发。主要功能包括可视化流程编辑、算法工具箱、图像采集与标定、检测结果可视化等,适用于质检、定位和缺陷分析,显著提高生产线效率和产品合格率。

WPF + Halcon + YOLO 工业视觉检测的全能上位机

dotNET跨平台
dotNET跨平台 · 2026-04-29T23:58:04Z
解决“打地鼠困境”:一种更智能的去偏见AI视觉模型的方法

WRING是一种新型去偏见技术,通过调整模型中特定坐标的表示方式,减少目标概念的偏见,同时不增加其他领域的偏见。该方法高效且无需重新训练模型,适用于视觉语言模型(VLM),如CLIP模型。研究表明,WRING在减少偏见方面效果显著。

解决“打地鼠困境”:一种更智能的去偏见AI视觉模型的方法

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2026-04-29T21:40:00Z

松竹株式会社创新推进部游戏事业室宣布,PC平台新作视觉小说游戏《心象演算》(Algorithm...

以追求“对彼此而言最合适的百分之一好感度”为目标的沉浸式恋爱视觉小说游戏《心象演算》免费试玩版现已正式上线!

游戏研究社
游戏研究社 · 2026-04-29T13:25:00Z
Cognex宣布推出In-Sight 6900视觉控制器

Cognex推出In-Sight 6900视觉控制器,具模块化设计,支持灵活配置摄像头和照明系统。该产品基于NVIDIA Jetson技术,具备强大的AI处理能力,适用于复杂工业检测,能够在动态环境中提供一致的检测结果,并可与OneVision平台无缝集成。

Cognex宣布推出In-Sight 6900视觉控制器

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-29T07:07:33Z
NVIDIA推出Nemotron 3 Nano Omni模型,整合视觉、音频和语言,实现高达9倍的AI代理效率

NVIDIA推出Nemotron 3 Nano Omni模型,将视觉、音频和语言整合为一个系统,显著提升AI代理的效率和准确性。该模型具备高达9倍的处理能力,适用于客户支持、文档智能和音视频理解等领域,并支持开放定制,适合多种部署环境。

NVIDIA推出Nemotron 3 Nano Omni模型,整合视觉、音频和语言,实现高达9倍的AI代理效率

NVIDIA Blog
NVIDIA Blog · 2026-04-28T16:00:28Z

文章讨论了软件开发工具的演变,特别是4GL工具(如FoxPro和Visual Basic)与现代基于LLM的编码代理的比较。过去,开发者能够快速构建应用程序,而如今的编码代理提高了开发效率,但也增加了对底层代码理解的挑战。此外,企业对IT部门的看法(作为创新中心还是成本中心)影响着开发团队的结构和项目管理。

我认为我认为的事情……代理与(视觉)FoxPro

Neward & Asocciates, LLC Blog
Neward & Asocciates, LLC Blog · 2026-04-28T00:00:00Z
iNeuOS工业互联网操作系统无缝集成视觉分析(iNeuOS_Vision_Detect)

随着工业企业对智能化的需求增加,iNeuOS与视觉分析模块iNeuOS_Vision_Detect的结合提升了运维效率。该平台整合视觉结果与实时数据,简化操作流程,支持复杂应用组合,实现视觉能力与工业平台的深度融合。用户可管理视觉分析任务,确保视觉结果实时更新并可追溯,形成完整的业务闭环。

iNeuOS工业互联网操作系统无缝集成视觉分析(iNeuOS_Vision_Detect)

dotNET跨平台
dotNET跨平台 · 2026-04-26T00:01:10Z
HTD——基于触觉预测的人形行走-操作框架:融合视觉、本体感知、力反馈、触觉,同时预测动作、未来手部关节受力、由EMA目标编码器监督的未来触觉潜变量

本文探讨了人形机器人在“行走-操作”任务中的挑战,提出了一种集成式全身操控系统,结合强化学习、VR遥操作和触觉感知。研究者开发了具身触觉梦境的Transformer(HTD),通过多模态学习提升机器人对接触状态的理解和反应能力,简化了学习过程,旨在提高人形机器人的操作能力和灵活性。

HTD——基于触觉预测的人形行走-操作框架:融合视觉、本体感知、力反馈、触觉,同时预测动作、未来手部关节受力、由EMA目标编码器监督的未来触觉潜变量

结构之法 算法之道
结构之法 算法之道 · 2026-04-23T10:29:30Z
Claude Opus 4.7发布,具备更好的视觉、记忆和指令遵循能力

Anthropic发布了Claude Opus 4.7,提升了指令遵循、视觉、创造力和记忆能力。新模型在复杂任务上表现更佳,但安全性略有下降,用户需调整提示以适应变化。Opus 4.7在金融分析等领域表现出色,并具备自动检测高风险请求的安全措施。

Claude Opus 4.7发布,具备更好的视觉、记忆和指令遵循能力

The New Stack
The New Stack · 2026-04-16T17:56:33Z
刘壮陈丹琦新作:开源通用视觉推理RL框架,0思考数据刷新SOTA

刘壮和陈丹琦团队推出了开源视觉推理强化学习框架Vero,支持多种视觉任务,克服了单一任务训练的局限性。Vero通过600K高质量样本和任务路由奖励机制,在多项基准测试中超越现有模型,展示了广泛数据对视觉推理的促进作用。

刘壮陈丹琦新作:开源通用视觉推理RL框架,0思考数据刷新SOTA

量子位
量子位 · 2026-04-11T01:23:42Z
《微型妻子》是一场视觉幻术的练习

《微型妻子》改编自曼努埃尔·冈萨雷斯的短篇小说,讲述一位女性因丈夫意外缩小而面临的挑战。剧集通过视觉特效展示她的微小世界,强调日常物品的威胁,并探讨夫妻关系与科技文化。VFX主管阿什利·伯内斯结合实景拍摄与复杂特效,创造出奇幻而真实的视觉效果。该剧将于4月9日在Peacock首播。

《微型妻子》是一场视觉幻术的练习

The Verge
The Verge · 2026-04-08T15:00:00Z
谈谈 Windows 的视觉风格与交互演变

文章讨论了Windows 11的视觉风格与交互演变,指出其同时包含多种界面风格,探讨了这是否反映了设计上的保守或其他原因。

谈谈 Windows 的视觉风格与交互演变

少数派
少数派 · 2026-04-08T06:05:12Z
Meta AI发布EUPE:一款参数量低于1亿的紧凑型视觉编码器,可同时处理各种视觉任务

Meta公司推出了一种紧凑型视觉编码器EUPE,能够同时处理多种视觉任务。它采用“先扩大规模,再缩小规模”的方法,将多个专家模型的知识整合到一个代理模型中,并提炼出高效的学生模型,从而解决边缘设备计算资源不足的问题。

Meta AI发布EUPE:一款参数量低于1亿的紧凑型视觉编码器,可同时处理各种视觉任务

实时互动网
实时互动网 · 2026-04-08T02:22:37Z
太能打了:小卡也能跑的视觉模型!Gemma 4 本地视觉实测,截图转HTML

谷歌发布的Gemma 4开源模型在视觉理解和代码生成方面表现优异,尤其是26B版本。尽管小模型在视觉处理上有所欠缺,但在文本理解和代码生成方面依然表现良好,突显了表达能力在AI应用中的重要性。

太能打了:小卡也能跑的视觉模型!Gemma 4 本地视觉实测,截图转HTML

dotNET跨平台
dotNET跨平台 · 2026-04-05T23:56:36Z
BRS——斯坦福李飞飞团队推出的全身轮式人形操作框架:推出遥操作接口JoyLo与全身视觉-运动注意策略WB-VIMA

斯坦福李飞飞团队推出的BEHAVIOR ROBOT SUITE(BRS)框架,旨在提升机器人在家庭任务中的全身操控能力。BRS结合了低成本的JoyLo遥操作接口和新型的WB-VIMA学习算法,解决了机器人在执行复杂家务时的硬件和学习挑战。JoyLo通过简单的控制器实现高效的全身控制,而WB-VIMA则通过自回归解码协调全身动作,提升了机器人的操作精度和灵活性。

BRS——斯坦福李飞飞团队推出的全身轮式人形操作框架:推出遥操作接口JoyLo与全身视觉-运动注意策略WB-VIMA

结构之法 算法之道
结构之法 算法之道 · 2026-04-04T16:31:05Z
开卷视觉编程!GLM-5V-Turbo上线,一张草图搞定前端

GLM-5V-Turbo是一款新推出的视觉编程模型,能够根据草图生成前端代码并解读复杂图表。它在多模态任务中表现出色,支持网页浏览和报告生成,适合产品经理和学生使用。该模型通过多项技术升级,增强了视觉理解和任务协同能力。

开卷视觉编程!GLM-5V-Turbo上线,一张草图搞定前端

量子位
量子位 · 2026-04-02T06:28:33Z
美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

LongCat团队提出了LongCat-Next模型,旨在统一处理图像、语音和文本等多模态信号。该模型通过离散Token实现理解与生成的协同,打破模态间的隔阂,表现出色。模型及其分词器已开源,期待推动多模态智能的发展。

美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

美团技术团队
美团技术团队 · 2026-04-02T00:00:00Z
《超级马里奥银河电影》视觉美丽但略显繁忙

《超级马里奥银河电影》是一部视觉震撼但故事平淡的影片,结合了多个马里奥游戏元素,讲述了马里奥兄弟与公主桃子及新朋友约西的冒险。影片节奏较快,适合儿童,但故事深度不足,角色发展不够。影片于4月1日上映。

《超级马里奥银河电影》视觉美丽但略显繁忙

The Verge
The Verge · 2026-03-31T19:00:00Z
苹果50年:视觉历史

苹果公司成立50周年,回顾其从初创企业到全球巨头的历程。文章提到1984年麦金塔革命、iMac的推出及iPhone的热销,强调苹果对科技和文化的深远影响。

苹果50年:视觉历史

The Verge
The Verge · 2026-03-31T11:00:00Z
数据集汇总丨英伟达/OpenAI及多所科研机构开源推理数据集,覆盖数学/全景空间/Wiki问答/科研任务/视觉常识等

大模型的发展凸显了推理数据的重要性,优质推理数据集支持复杂推理任务。HyperAI整理了多领域推理数据集,降低了使用门槛,促进科研与模型训练。

数据集汇总丨英伟达/OpenAI及多所科研机构开源推理数据集,覆盖数学/全景空间/Wiki问答/科研任务/视觉常识等

HyperAI超神经
HyperAI超神经 · 2026-03-27T09:49:53Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码