小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
大规模 RTSP 流媒体传输:架构和性能考量

实时流媒体协议(RTSP)在监控领域的复兴,因其支持物体识别等智能功能,降低了硬件更换成本。RTSP确保IP摄像头的互操作性,适应现代工作流程,提供低延迟视频传输,并支持TCP和UDP,以满足不同应用需求。通过优化架构,企业可利用传统视频流挖掘新价值,并结合AI技术提升监控效率。

大规模 RTSP 流媒体传输:架构和性能考量

实时互动网
实时互动网 · 2026-02-12T08:10:28Z
Narwal的Flow 2扫地机器人可能帮助你找到丢失的耳环

Narwal推出了Flow 2扫地机器人,具备新设计和清洁模式,能够识别并定位掉落的贵重物品,如首饰和手机。其AI系统支持无限物体识别,并在检测到玩具时提醒用户。Flow 2的吸力提升至30,000Pa,并提供热水拖地功能,预计于2026年4月上市。

Narwal的Flow 2扫地机器人可能帮助你找到丢失的耳环

The Verge
The Verge · 2026-01-04T14:00:00Z
方法教会生成式AI模型定位个性化物体

麻省理工学院研究人员提出了一种新方法,利用视频追踪数据提升视觉语言模型(VLM)在图像中定位个性化物体的能力,如宠物。这种方法提高了定位准确性,为未来AI在物体追踪和辅助技术方面的应用提供了可能性。

方法教会生成式AI模型定位个性化物体

MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL)
MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL) · 2025-10-16T04:00:00Z

Apache TVM 是一个适用于嵌入式设备的深度学习编译框架。本文介绍如何训练 MobileNetV1 模型并将其部署到 Arduino,实现物体识别。教程包括数据集准备、模型训练、量化和编译,最终使模型在 Arduino 上运行。

【TVM教程】在 Arduino 上为 microTVM 训练视觉模型

HyperAI超神经
HyperAI超神经 · 2025-04-27T08:52:58Z

本研究提出V$^2$R-Bench基准框架,以评估大型视觉语言模型(LVLM)在视觉变化(如位置、尺度、方向和上下文)下的鲁棒性。结果表明,即使是表现优秀的模型在简单物体识别任务中也存在不足,揭示了其架构设计的缺陷,强调未来设计需进行创新。

V$^2$R-Bench:全面评估大型视觉语言模型对基本视觉变化的鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本研究评估了视觉语言模型(VLMs)在基础视觉概念理解方面的不足,发现其在物体识别上表现良好,但在方向和位置等低中级视觉能力上存在显著缺陷。

视觉语言模型在神经心理学测试中显示广泛的视觉缺陷

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z

HuggingFace推出HuggingSnap应用,支持iOS、macOS和visionOS,利用本地smolvlm2模型实现离线实时物体识别,节省电量,适合购物、旅行和学习等场景。

HuggingFace推出iOS应用 无需联网即可使用本地视觉模型描述用户周围的内容

蓝点网
蓝点网 · 2025-03-20T07:01:01Z
2025 年的智能眼镜:人工智能和 AR 技术的未来发展

智能眼镜结合人工智能与增强现实,提供沉浸式体验和实时数据集成。新型号支持语音助手、实时翻译和物体识别,增强用户交互。尽管存在电池寿命和隐私问题,智能眼镜在医疗和企业应用中展现广阔前景,未来可能取代传统设备。

2025 年的智能眼镜:人工智能和 AR 技术的未来发展

实时互动网
实时互动网 · 2025-03-20T01:42:29Z

谷歌DeepMind今天发布了一系列新的Gemini模型,专为机器人设计。Gemini Robotics是一个视觉-语言-动作模型,能够将自然语言和图像转化为机器人动作。Gemini Robotics-ER模型增强了识别3D空间中物体及其部件的能力,使机器人能够完成折纸、打包午餐等任务。

深入了解我们新的Gemini机器人模型

The Keyword
The Keyword · 2025-03-12T17:01:00Z

本研究探讨了深度神经网络在物体识别中产生偏见的原因,尽管训练数据均衡。研究通过几何分析框架发现,类别感知流形的几何复杂性差异导致识别能力不均,从而引入偏见。

Revealing Bias Formation in Deep Neural Networks Through the Geometric Mechanisms of Human Visual Decoupling

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

YOLOv11 是一款新一代目标检测模型,提升了检测精度和复杂场景适应能力,支持物体检测、分类和姿态估计等多种视觉任务。在自动驾驶中表现优异,能够精准识别车辆、行人和交通标志。HyperAI 提供了一键部署教程,方便用户快速体验 YOLOv11 的强大功能。

在线教程|YOLOv11 实战!速度与精度双全的目标检测神器

HyperAI超神经
HyperAI超神经 · 2024-12-05T12:34:25Z
探索胶囊网络在人工智能中的被低估潜力

胶囊网络(CapsNets)是一种新型神经网络架构,旨在克服传统卷积神经网络(CNNs)在空间层次和关系处理上的局限。CapsNets通过动态路由机制有效捕捉物体空间关系,提升对物体旋转和遮挡的识别能力。它们在医学成像、自动驾驶和机器人等领域具有广泛应用潜力,但仍面临计算复杂性和可扩展性挑战。

探索胶囊网络在人工智能中的被低估潜力

DEV Community
DEV Community · 2024-11-12T21:40:19Z

本研究探讨了上下文信息对物体识别模型准确性的影响,发现对象体积的影响显著高于上下文体积,并揭示上下文变化对模型性能的影响超出预期,为物体识别模型的改进提供了新见解。

迷失在上下文中:上下文对物体识别特征归因方法的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z

本研究探讨了机器学习在不同视角下识别同一物体的挑战,借鉴幼儿的注视行为。提出了一种生物启发的视觉学习模型,证明幼儿的视觉体验能增强物体表示学习,支持自我监督学习。

主动注视行为促进自我监督的物体学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

我们提出了一种基于稳定循环网络的“动态网络架构”智能系统,应用于视觉领域。该模型通过自组织机制和Hebbian可塑性,能够在高噪声环境中保持线条表示的稳定性,并从部分遮挡中重建特征。研究重点在大脑皮层区域,展望未来的物体识别能力。

递归神经网络模型中自然主义物体表征的几何特征

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本研究提出了一种新方法,通过解耦槽注意力模块,解决了物体中心学习在不同场景下识别相同物体的难题。实验结果表明,该方法在物体识别和复杂场景生成方面表现优异,具有重要应用潜力。

通过解耦槽注意力学习全局物体中心表示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

自1950年代以来,人工智能不断发展,现在在虚拟现实中起重要作用。AI通过优化图形渲染、物体识别、行为分析和个性化定制来提升VR体验。

人工智能在提升虚拟现实体验中的作用

DEV Community
DEV Community · 2024-10-07T03:45:07Z

本研究使用新型实验评估了DNN颜色嵌入的感知一致性,并通过在线调查评估了这些算法如何预测人类的颜色相似性判断。结果显示,基于小波分解的可解释和基于认知的颜色知觉模型提供更一致的颜色嵌入结果,更好地预测了人类的颜色判断。这些发现对于分析机器学习算法的感知表示和改进其作为人类视觉的认知合理模型具有创新意义。

基于深度学习评估中国西南民族绣品的视觉相似性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-26T00:00:00Z

本文介绍了一种名为“动态网络架构”的智能系统架构,该架构依赖于稳定循环网络,并讨论了其在视觉上的应用。通过动态连接主义原则,该模型能够稳定初级传入信号引起的神经激活,并能够从部分遮挡的输入中重建预期特征。研究限制了DNA在一个大脑皮层区域,并提供了关于该区域的优势和不足的深入理解。未来的工作将探索如何通过组合多个区域来实现不变的物体识别。

PushPull网络:抗干扰的ResNet

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z

本研究提出了一种深度学习方法,将高分辨率训练数据中的细粒度知识传递到低分辨率测试场景中,具有实际应用价值。实验结果显示该方法在物体识别方面表现出色。

具有鲁棒性和可解释性的细粒度视觉分类与迁移学习:双车道框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-09T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码