小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
使用TensorFlow和PyCharm为Reachy Mini构建实时物体检测应用

本文介绍了如何使用TensorFlow和PyCharm构建实时物体检测应用,并将其部署到Reachy Mini机器人上。教程分为两个阶段:第一阶段在笔记本上测试检测管道,第二阶段将其集成到机器人中,实现头部跟踪和实时数据流。使用SSD MobileNet V2模型,用户可以轻松实现物体检测和自定义开发。

使用TensorFlow和PyCharm为Reachy Mini构建实时物体检测应用

The JetBrains Blog
The JetBrains Blog · 2026-05-27T14:06:31Z
Ultralytics创始人Glenn Jocher将在OSCCA大会上发表演讲

Ultralytics创始人Glenn Jocher将在2026年5月4日的OSCCA大会上发表预录演讲,介绍YOLO这一全球最快、最准确的物体检测AI。该技术每天处理25亿次模型推理,广泛应用于机器人、医疗和制造业。此次演讲仅限与会者观看。

Ultralytics创始人Glenn Jocher将在OSCCA大会上发表演讲

OpenCV
OpenCV · 2026-04-06T18:58:47Z
07-HarmonyOS5-物体检测案例

本文介绍了一款基于HarmonyOS 5.0和ArkTS语言开发的物体检测应用,用户可选择图片进行物体识别,应用展示检测区域及详细信息,包括置信度、标签和尺寸。

07-HarmonyOS5-物体检测案例

DEV Community
DEV Community · 2025-05-30T03:06:10Z

本研究利用Instruct Pix2Pix扩散模型生成天气基数据集,以增强自动驾驶物体检测系统在恶劣天气下的鲁棒性和识别能力。

恶劣天气条件下用于自动驾驶汽车的物体检测:基于Instruct Pix2Pix的方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究分析了全无人商店中人工智能自动结算系统的安全漏洞,揭示了对抗性补丁攻击对物体检测模型的影响,可能导致盗窃和库存差异。提出了新型损失函数和攻效度量,强调了提升防御策略的必要性。

Robustness Analysis against Adversarial Patch Attacks in Fully Unmanned Stores

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z
使用Python掌握计算机视觉基础

计算机视觉是人工智能的一个分支,旨在使系统能够识别图像或视频中的对象和场景。本文介绍了如何使用Python和YOLO模型进行实时物体检测,包括设置虚拟环境和安装必要库。通过摄像头捕捉图像,系统能够识别并标记对象,展示计算机视觉在各行业的应用潜力。

使用Python掌握计算机视觉基础

DEV Community
DEV Community · 2025-05-12T23:10:07Z
超越YOLO:实现D-FINE物体检测以获得更高精度

物体检测是计算机视觉中的重要任务。尽管YOLO因其速度和简便性广受欢迎,但新方法D-FINE因其更高的准确性而受到研究人员的关注。

超越YOLO:实现D-FINE物体检测以获得更高精度

DEV Community
DEV Community · 2025-05-10T03:33:47Z

Perception-R1是由多所高校联合开发的多模态大语言模型,首次在COCO2017验证集上实现30AP,超越YOLOv3等模型。该模型通过强化学习优化视觉感知策略,提升了物体检测、计数和OCR等任务的能力,为AI视觉感知的未来奠定基础。

用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源

量子位
量子位 · 2025-05-03T04:15:09Z

本研究提出了一种合成数据增强流程,以模拟自主驾驶中的传感器故障,旨在提高物体检测和跟踪的鲁棒性。通过训练轻量级噪声识别神经网络,识别准确率达到54.4%,从而提升自动驾驶系统的稳定性和可靠性。

Synthesis and Identification of Noise Levels in Autonomous Vehicle Camera Radar Datasets

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z
探讨物体定位与物体检测的关键区别

物体定位和检测是计算机视觉技术,用于自动识别图像或视频中的物体及其位置。物体定位关注单个物体,而物体检测则可识别多个物体并进行分类。这两项技术广泛应用于自动驾驶、安防和医疗成像等领域。

探讨物体定位与物体检测的关键区别

DEV Community
DEV Community · 2025-04-25T10:49:41Z

本文介绍了一种专为10-12岁上肢残疾儿童设计的人工智能视觉辅助假手,具有仿生外观和多关节功能,旨在为低收入家庭提供经济实惠的解决方案。该假手通过3D打印和机器视觉实现高效的物体检测与抓取分类。

Visual-Aided Prosthetic Hand for Upper Limb Disabled Children

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z

本研究提出了一种新颖的变接收场DETR(VRF-DETR)方法,旨在解决无人机空中物体检测中的低于10像素目标、密集遮挡和计算限制等问题。该方法通过多尺度上下文融合和门控卷积等技术,提高了检测的准确性和效率,并在VisDrone2019数据集上取得了优异表现。

Efficient Aerial Image Detection with Variable Receptive Fields

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-21T00:00:00Z
Adirik在Replicate上发布的Grounding-Dino模型初学者指南

Grounding-Dino是由Adirik维护的AI模型,能够通过文本输入检测图像中的物体。它结合了DINO检测器和基础预训练,支持开放词汇和文本引导的物体检测,输出带有边界框和标签的结果。

Adirik在Replicate上发布的Grounding-Dino模型初学者指南

DEV Community
DEV Community · 2025-04-13T06:40:36Z

本研究提出了一种新颖的频率动态卷积(FDConv)方法,旨在解决动态卷积在适应性和参数成本方面的局限性。FDConv通过在傅里叶域中学习固定参数预算,构建频率多样化的权重。实验结果表明,该方法在物体检测、分割和分类任务中表现优越,展现了在现代视觉任务中的灵活性和效率。

Frequency Dynamic Convolution for Dense Image Prediction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z

计算机视觉是人工智能的重要分支,旨在使计算机理解图像和视频。其应用包括微软的Seeing AI,帮助盲人识别环境。核心能力包括图片分类、物体检测和语义分割,广泛应用于医疗、安防和自动驾驶等领域。

计算机视觉

dotNET跨平台
dotNET跨平台 · 2025-03-19T00:01:20Z

本研究提出了一种新方法LED,旨在解决开放词汇物体检测中的偏见和过拟合问题。实验结果表明,该方法利用大型语言模型的隐藏状态,在复杂查询中的性能显著提升。

LED:无须人工策划数据生成的LLM增强开放词汇物体检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z

本研究提出了一种新型稀疏视觉变压器模型SparseFormer,旨在提高高分辨率宽图像中的物体检测准确性和效率。该模型通过选择性注意力标记,结合全局与局部关注,处理尺度变化,并利用非极大抑制算法精确定位物体。实验结果表明,SparseFormer在准确性和速度上显著优于现有方法。

Sparse Transformer: Detecting Objects in High-Resolution Wide Images via Sparse Vision Transformer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出了一种改进的YOLOv8m模型,旨在提高高压输电线路中外部物体检测的准确性。通过增加全球注意力模块和Focal-EIoU损失函数,显著提升了检测效果,增强了安全性。

External Object Detection in High-Voltage Transmission Lines Based on Improved YOLOv8m

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出Mamba架构,解决变压器在物体检测和视频理解中的可扩展性问题。该架构通过状态空间模型实现线性可扩展性和高效处理,增强了上下文意识,对图像和视频理解具有重要影响。

A Review of the Mamba Architecture in Visual Applications

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出了一种新型位置编码方法STRING,克服了大型语言模型中旋转位置编码的局限性。STRING在保持低计算开销的同时,实现了精确的平移不变性,并在视觉变换器中应用,显著提升了开放词汇物体检测和机器人控制的效果。

Learning RoPEs: Enhancing 2D and 3D Positional Encoding with STRING

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码