小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
一款应用于工业物联网项目上基础视觉识别服务,使用 .net Core 与 Yolo 识别服务开发的 WebApi 服务 ,开箱即用

VisualIdentity是一款开源免费的视觉识别API服务,旨在帮助开发者解决模型管理和多任务识别的问题。它具备现代化能力和高性能推理,支持多模型管理、单机多任务识别及跨平台部署,适用于工业质检、零售分析和智能安防等场景。

一款应用于工业物联网项目上基础视觉识别服务,使用 .net Core 与 Yolo 识别服务开发的 WebApi 服务 ,开箱即用

dotNET跨平台
dotNET跨平台 · 2026-05-28T00:00:00Z
带摄像头的 AI 耳机能替代 iPhone 吗?我戴了 72 小时之后有了答案

光帆科技推出首款带摄像头的AI耳机,旨在替代手机,提供主动式AI助手功能。耳机通过云端处理信息,支持日程管理和视觉识别,但存在延迟和隐私顾虑。整体设计包括耳机、耳机盒和智能手表,三者协同工作,展示了未来个人终端的潜力。

带摄像头的 AI 耳机能替代 iPhone 吗?我戴了 72 小时之后有了答案

爱范儿
爱范儿 · 2026-05-26T15:46:47Z
【案例共创】码道小工匠,儿童跳绳智能计数系统开发实战

本案例介绍了儿童跳绳智能计数系统的开发,利用华为云CodeArts代码智能体,通过音频分析和视觉识别技术,实现跳绳次数的自动统计,简化家长和教师的工作,适用于家庭和校园。

【案例共创】码道小工匠,儿童跳绳智能计数系统开发实战

华为云官方博客
华为云官方博客 · 2026-04-05T04:00:00Z
多模型智能识别平台还能这么玩?.NET 10 + YOLO + AI 解锁工业级视觉应用新姿势

该项目基于.NET 10架构,结合YoloDotNet推理引擎与SQLite存储,旨在解决多任务视觉识别中的模型管理与协同部署问题。提供智能识别平台,支持多模型管理与跨平台部署,降低AI应用落地门槛,助力开发者创新。

多模型智能识别平台还能这么玩?.NET 10 + YOLO + AI 解锁工业级视觉应用新姿势

dotNET跨平台
dotNET跨平台 · 2026-01-20T23:55:37Z
30秒做应用、实时写图文,「灵光」想用AI重塑创造力边界

灵光是一款新型AI助手,能够将自然语言请求转化为3D模型和交互地图,简化应用开发过程。通过视觉识别,灵光实现自然互动,降低创造门槛,让普通人也能轻松创作。

30秒做应用、实时写图文,「灵光」想用AI重塑创造力边界

爱范儿
爱范儿 · 2025-11-18T05:14:33Z

1688在云栖大会推出AI产品“遨虾”,旨在简化中小企业的跨境采购流程。该产品利用视觉识别和语义分析,快速匹配国内工厂,缩短选品时间,并提供多语言支持和合规提示。1688的AI布局基于26年的数据积累,推动B2B全链路智能经营,提升决策效率,促进商业模式演进。

1688AI矩阵亮相云栖大会 跨境智能体“遨虾”启动内测

量子位
量子位 · 2025-09-24T07:29:50Z
C# 开源视觉与运动控制集成平台,模块化设计赋能工业自动化

本文介绍了一款开源视觉系统,结合视觉识别与运动控制技术,旨在提升工业自动化效率。该系统采用模块化设计,支持多种算法库集成,具备可视化界面和动态布局管理,降低开发门槛,适用于复杂场景。

C# 开源视觉与运动控制集成平台,模块化设计赋能工业自动化

dotNET跨平台
dotNET跨平台 · 2025-09-23T23:57:37Z
【AI入门课程系列】5、AI 如何看见东西?—— 机器视觉

AI通过摄像头捕捉图像,利用视觉算法提取特征并与记忆库对比,实现物体识别。传统模型专注于单一物体识别,而大模型能够同时识别多种物体并灵活判断新图像。

【AI入门课程系列】5、AI 如何看见东西?—— 机器视觉

分享AI芯片开发经验
分享AI芯片开发经验 · 2025-09-19T08:39:20Z
《我看见的世界:李飞飞自传》

李飞飞的自传《我看见的世界》探讨了人工智能的发展,从“符号人工智能”到“机器学习”的转变。她强调人类大脑的复杂性与学习能力,指出视觉识别研究对人工智能的重要性,并提到数据集如ImageNet和WordNet在推动机器智能方面的作用,以及对人类尊严的关注。

《我看见的世界:李飞飞自传》

Frytea's Blog
Frytea's Blog · 2025-07-20T15:56:26Z
断网都没用,机器人终于「摆脱」人类控制!Google 首发离线 AI 大脑,一句话让它干活

Google DeepMind推出Gemini Robotics On-Device机器人控制模型,该模型可在本地离线运行,具备视觉识别、语言理解和动作执行能力。通过少量示范学习,模型能快速适应多种任务,推动机器人技术的普及与应用,但安全性和多步骤逻辑规划仍需改进。

断网都没用,机器人终于「摆脱」人类控制!Google 首发离线 AI 大脑,一句话让它干活

爱范儿
爱范儿 · 2025-06-25T03:57:14Z
10个激发灵感的平面设计项目创意

个人设计项目能够激发创意并丰富作品集。文章提供了10个项目建议,如重新设计经典书籍封面、创建虚构品牌视觉识别和设计专辑封面,鼓励设计师探索新技术和风格,提升创作能力。

10个激发灵感的平面设计项目创意

Design Shack
Design Shack · 2025-05-03T09:00:13Z

本文提出了一种自监督学习方案,以提高无人机在无GPS环境中的自我运动估计能力。通过改进遮挡处理方法,显著提升了无人机在高速飞行和接近障碍物时的视觉识别准确性,增强了实际应用表现。

Self-Supervised Monocular Visual Drone Model Identification through Improved Occlusion Handling

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-30T00:00:00Z

华盛顿特区检察官质疑维基媒体基金会的非营利地位,指控其被外国势力操控信息。ICE驱逐三名美国公民子女,引发人权关注。OpenAI的o3模型展现出强大的视觉识别能力,但引发隐私担忧。新理论认为前列腺问题可能由精索静脉功能不全引起,建议手术修复。

2025 04 27 HackerNews

介绍 on SuperTechFans
介绍 on SuperTechFans · 2025-04-27T00:25:57Z
字体心理学:排版如何塑造品牌认知

字体心理学影响品牌认知,合适的字体能增强品牌形象,传达专业性或友好感。不同字体如衬线体、无衬线体和手写体各具特点,适用于不同场合。了解字体心理有助于提升品牌设计的视觉识别和信任感。

字体心理学:排版如何塑造品牌认知

Design Shack
Design Shack · 2025-04-09T08:00:14Z

本研究分析了视觉语言模型(VLMs)在处理ASCII艺术时的局限性,发现其在文本与视觉模式冲突时存在文本优先偏见,且随着语义复杂度的增加,视觉识别能力下降。这为未来模型的改进提供了参考。

Text Over Visuals: ASCII Art Reveals Text Bias in Vision-Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z
2025年每位开发者都应了解的14个AI API

AI API正在改变机器学习与应用的整合,提供自然语言处理和视觉识别等功能。主要API包括OpenAI、Google Cloud和Azure,帮助企业构建聊天机器人和图像生成,提升用户体验和创造力。

2025年每位开发者都应了解的14个AI API

DEV Community
DEV Community · 2025-03-05T14:06:02Z

多模态大模型的事实正确性评估显示,o1模型表现最佳,但普遍过于自信。研究基于ChineseSimpleVQA基准,涵盖2200个问题,分析了模型的视觉识别能力和知识水平。模型在现代建筑和科学领域表现优异,但知识扩展能力有限,错误率较高。评测集经过严格质量控制,确保数据的高质量和安全性。

多模态大模型事实正确性评估:o1最强,模型普遍过于自信,最擅长现代建筑/工程技术/科学

量子位
量子位 · 2025-02-23T06:06:08Z
北大彭宇新教授团队开源细粒度多模态大模型Finedefics

北京大学彭宇新教授团队提出的细粒度多模态大模型Finedefics,解决了多模态大模型在细粒度视觉识别中的不足。通过构建视觉对象的细粒度属性知识和对比学习,Finedefics在多个数据集上的识别准确率平均达到76.84%,显著优于其他模型。

北大彭宇新教授团队开源细粒度多模态大模型Finedefics

机器之心
机器之心 · 2025-02-17T09:25:45Z

宇树科技推出的新款人形机器人Unitree G1-Comp,专为机器人世界杯RoboCup设计,具备灵活运动和视觉识别能力,目标是到2050年战胜人类足球队。G1-Comp技术升级,支持强化学习和多种开发接口,成为人形机器人领域的新星。

宇树机器人让中国足球冲入“世界杯”!网友:新技能可太长脸了

量子位
量子位 · 2025-01-22T07:14:37Z

本研究提出了一种新的视觉到概念(V2C)标记器,旨在解决传统概念瓶颈模型在视觉识别中对专家知识的依赖。通过该标记器,可以直接从多模态模型构建概念瓶颈模型,从而显著提高分类准确性和可解释性。研究结果表明,V2C-CBM在多个视觉分类基准测试中表现优异。

V2C-CBM: Building Concept Bottlenecks with Vision-to-Concept Tokenizer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码