小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Gemma 4是最新的开源模型,已被下载超过1.5亿次。它支持低延迟的离线应用,如HubX的英语辅导平台BetterSpeak,利用量化模型实现私密学习。此外,Gemma 4具备视觉语言处理能力,能够进行物体识别和图像描述,适用于多种创意项目。

看看三位开发者如何利用Gemma 4进行创作

The Keyword
The Keyword · 2026-06-09T16:00:00Z
大规模 RTSP 流媒体传输:架构和性能考量

实时流媒体协议(RTSP)在监控领域的复兴,因其支持物体识别等智能功能,降低了硬件更换成本。RTSP确保IP摄像头的互操作性,适应现代工作流程,提供低延迟视频传输,并支持TCP和UDP,以满足不同应用需求。通过优化架构,企业可利用传统视频流挖掘新价值,并结合AI技术提升监控效率。

大规模 RTSP 流媒体传输:架构和性能考量

实时互动网
实时互动网 · 2026-02-12T08:10:28Z
Narwal的Flow 2扫地机器人可能帮助你找到丢失的耳环

Narwal推出了Flow 2扫地机器人,具备新设计和清洁模式,能够识别并定位掉落的贵重物品,如首饰和手机。其AI系统支持无限物体识别,并在检测到玩具时提醒用户。Flow 2的吸力提升至30,000Pa,并提供热水拖地功能,预计于2026年4月上市。

Narwal的Flow 2扫地机器人可能帮助你找到丢失的耳环

The Verge
The Verge · 2026-01-04T14:00:00Z
方法教会生成式AI模型定位个性化物体

麻省理工学院研究人员提出了一种新方法,利用视频追踪数据提升视觉语言模型(VLM)在图像中定位个性化物体的能力,如宠物。这种方法提高了定位准确性,为未来AI在物体追踪和辅助技术方面的应用提供了可能性。

方法教会生成式AI模型定位个性化物体

MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL)
MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL) · 2025-10-16T04:00:00Z

Apache TVM 是一个适用于嵌入式设备的深度学习编译框架。本文介绍如何训练 MobileNetV1 模型并将其部署到 Arduino,实现物体识别。教程包括数据集准备、模型训练、量化和编译,最终使模型在 Arduino 上运行。

【TVM教程】在 Arduino 上为 microTVM 训练视觉模型

HyperAI超神经
HyperAI超神经 · 2025-04-27T08:52:58Z

本研究提出V$^2$R-Bench基准框架,以评估大型视觉语言模型(LVLM)在视觉变化(如位置、尺度、方向和上下文)下的鲁棒性。结果表明,即使是表现优秀的模型在简单物体识别任务中也存在不足,揭示了其架构设计的缺陷,强调未来设计需进行创新。

V$^2$R-Bench:全面评估大型视觉语言模型对基本视觉变化的鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本研究评估了视觉语言模型(VLMs)在基础视觉概念理解方面的不足,发现其在物体识别上表现良好,但在方向和位置等低中级视觉能力上存在显著缺陷。

视觉语言模型在神经心理学测试中显示广泛的视觉缺陷

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z

HuggingFace推出HuggingSnap应用,支持iOS、macOS和visionOS,利用本地smolvlm2模型实现离线实时物体识别,节省电量,适合购物、旅行和学习等场景。

HuggingFace推出iOS应用 无需联网即可使用本地视觉模型描述用户周围的内容

蓝点网
蓝点网 · 2025-03-20T07:01:01Z
2025 年的智能眼镜:人工智能和 AR 技术的未来发展

智能眼镜结合人工智能与增强现实,提供沉浸式体验和实时数据集成。新型号支持语音助手、实时翻译和物体识别,增强用户交互。尽管存在电池寿命和隐私问题,智能眼镜在医疗和企业应用中展现广阔前景,未来可能取代传统设备。

2025 年的智能眼镜:人工智能和 AR 技术的未来发展

实时互动网
实时互动网 · 2025-03-20T01:42:29Z

谷歌DeepMind今天发布了一系列新的Gemini模型,专为机器人设计。Gemini Robotics是一个视觉-语言-动作模型,能够将自然语言和图像转化为机器人动作。Gemini Robotics-ER模型增强了识别3D空间中物体及其部件的能力,使机器人能够完成折纸、打包午餐等任务。

深入了解我们新的Gemini机器人模型

The Keyword
The Keyword · 2025-03-12T17:01:00Z

本研究探讨了深度神经网络在物体识别中产生偏见的原因,尽管训练数据均衡。研究通过几何分析框架发现,类别感知流形的几何复杂性差异导致识别能力不均,从而引入偏见。

Revealing Bias Formation in Deep Neural Networks Through the Geometric Mechanisms of Human Visual Decoupling

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

YOLOv11 是一款新一代目标检测模型,提升了检测精度和复杂场景适应能力,支持物体检测、分类和姿态估计等多种视觉任务。在自动驾驶中表现优异,能够精准识别车辆、行人和交通标志。HyperAI 提供了一键部署教程,方便用户快速体验 YOLOv11 的强大功能。

在线教程|YOLOv11 实战!速度与精度双全的目标检测神器

HyperAI超神经
HyperAI超神经 · 2024-12-05T12:34:25Z
探索胶囊网络在人工智能中的被低估潜力

胶囊网络(CapsNets)是一种新型神经网络架构,旨在克服传统卷积神经网络(CNNs)在空间层次和关系处理上的局限。CapsNets通过动态路由机制有效捕捉物体空间关系,提升对物体旋转和遮挡的识别能力。它们在医学成像、自动驾驶和机器人等领域具有广泛应用潜力,但仍面临计算复杂性和可扩展性挑战。

探索胶囊网络在人工智能中的被低估潜力

DEV Community
DEV Community · 2024-11-12T21:40:19Z

本研究提出了一种基于Gumbel空间剪枝的多扫描点云感知方法,旨在解决现有技术在户外环境中对远距或被遮挡物体识别的局限性。通过多次LiDAR扫描的累积和引入GSP层,显著提高了感知性能,同时未增加计算开销。

Efficient 3D Perception on Multi-Sweep Point Clouds Based on Gumbel Spatial Pruning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-12T00:00:00Z

本研究探讨了上下文信息对物体识别模型准确性的影响,发现物体体积归因比上下文体积归因更显著,且上下文变化对模型性能的影响超出预期,为改进物体识别模型提供了新见解。

Lost in Context: The Impact of Context on Feature Attribution Methods for Object Recognition

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z

本研究提出了一种解耦槽注意力模块,旨在解决现有物体中心学习方法在不同场景下识别相同物体的难题。该方法能够提取物体的全局不变属性,提升物体识别和复杂场景生成的能力。实验结果表明,该方法在全局物体中心表示学习和场景分解方面表现优异,具有重要的应用潜力。

Learning Global Object-Centric Representations via Disentangled Slot Attention

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

本文研究了深度卷积神经网络在物体识别中的表现,发现浅层网络在小视角变化时优于深层网络,而在大视角变化时,深层网络表现更佳。人类视觉系统在图像处理上更具鲁棒性,并与深度神经网络的误差模式存在显著差异。研究提出结合人类视觉显著性与主动学习的方法,以提高模型的可解释性和泛化能力。

利用人类显著性训练更好的深度学习模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

自1950年代以来,人工智能不断发展,现在在虚拟现实中起重要作用。AI通过优化图形渲染、物体识别、行为分析和个性化定制来提升VR体验。

人工智能在提升虚拟现实体验中的作用

DEV Community
DEV Community · 2024-10-07T03:45:07Z

本文介绍了一种结合局部视觉线索和投票机制的深度学习方法,用于检测部分遮挡对象。研究表明,结合卷积神经网络和CompositionalNets在处理遮挡问题时优于传统方法,能够有效识别和定位被遮挡的物体。

深度学习模型在视觉识别任务中对部分物体遮挡的鲁棒性研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-16T00:00:00Z

本文探讨了利用视觉和触觉传感器进行机器人3D形状重建和物体识别的方法。研究通过深度学习和贝叶斯算法提出了高效的触觉探索策略,能够在模拟和真实环境中重建物体形状,提升机器人在未知环境中的操作能力。结果显示,基于视觉的触觉传感器在织物纹理识别中表现优异,准确率显著提高。

通过触摸进行主动物体识别、姿态估计和形状迁移学习的贝叶斯框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码