小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
07-HarmonyOS5-物体检测案例

本文介绍了一款基于HarmonyOS 5.0和ArkTS语言开发的物体检测应用,用户可选择图片进行物体识别,应用展示检测区域及详细信息,包括置信度、标签和尺寸。

07-HarmonyOS5-物体检测案例

DEV Community
DEV Community · 2025-05-30T03:06:10Z

本研究利用Instruct Pix2Pix扩散模型生成天气基数据集,以增强自动驾驶物体检测系统在恶劣天气下的鲁棒性和识别能力。

恶劣天气条件下用于自动驾驶汽车的物体检测:基于Instruct Pix2Pix的方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究分析了全无人商店中人工智能自动结算系统的安全漏洞,揭示了对抗性补丁攻击对物体检测模型的影响,可能导致盗窃和库存差异。提出了新型损失函数和攻效度量,强调了提升防御策略的必要性。

Robustness Analysis against Adversarial Patch Attacks in Fully Unmanned Stores

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z
使用Python掌握计算机视觉基础

计算机视觉是人工智能的一个分支,旨在使系统能够识别图像或视频中的对象和场景。本文介绍了如何使用Python和YOLO模型进行实时物体检测,包括设置虚拟环境和安装必要库。通过摄像头捕捉图像,系统能够识别并标记对象,展示计算机视觉在各行业的应用潜力。

使用Python掌握计算机视觉基础

DEV Community
DEV Community · 2025-05-12T23:10:07Z
超越YOLO:实现D-FINE物体检测以获得更高精度

物体检测是计算机视觉中的重要任务。尽管YOLO因其速度和简便性广受欢迎,但新方法D-FINE因其更高的准确性而受到研究人员的关注。

超越YOLO:实现D-FINE物体检测以获得更高精度

DEV Community
DEV Community · 2025-05-10T03:33:47Z

Perception-R1是由多所高校联合开发的多模态大语言模型,首次在COCO2017验证集上实现30AP,超越YOLOv3等模型。该模型通过强化学习优化视觉感知策略,提升了物体检测、计数和OCR等任务的能力,为AI视觉感知的未来奠定基础。

用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源

量子位
量子位 · 2025-05-03T04:15:09Z

本研究提出了一种合成数据增强流程,以模拟自主驾驶中的传感器故障,旨在提高物体检测和跟踪的鲁棒性。通过训练轻量级噪声识别神经网络,识别准确率达到54.4%,从而提升自动驾驶系统的稳定性和可靠性。

Synthesis and Identification of Noise Levels in Autonomous Vehicle Camera Radar Datasets

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z
探讨物体定位与物体检测的关键区别

物体定位和检测是计算机视觉技术,用于自动识别图像或视频中的物体及其位置。物体定位关注单个物体,而物体检测则可识别多个物体并进行分类。这两项技术广泛应用于自动驾驶、安防和医疗成像等领域。

探讨物体定位与物体检测的关键区别

DEV Community
DEV Community · 2025-04-25T10:49:41Z

本文介绍了一种专为10-12岁上肢残疾儿童设计的人工智能视觉辅助假手,具有仿生外观和多关节功能,旨在为低收入家庭提供经济实惠的解决方案。该假手通过3D打印和机器视觉实现高效的物体检测与抓取分类。

Visual-Aided Prosthetic Hand for Upper Limb Disabled Children

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z

本研究提出了一种新颖的变接收场DETR(VRF-DETR)方法,旨在解决无人机空中物体检测中的低于10像素目标、密集遮挡和计算限制等问题。该方法通过多尺度上下文融合和门控卷积等技术,提高了检测的准确性和效率,并在VisDrone2019数据集上取得了优异表现。

Efficient Aerial Image Detection with Variable Receptive Fields

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-21T00:00:00Z
Adirik在Replicate上发布的Grounding-Dino模型初学者指南

Grounding-Dino是由Adirik维护的AI模型,能够通过文本输入检测图像中的物体。它结合了DINO检测器和基础预训练,支持开放词汇和文本引导的物体检测,输出带有边界框和标签的结果。

Adirik在Replicate上发布的Grounding-Dino模型初学者指南

DEV Community
DEV Community · 2025-04-13T06:40:36Z

本研究提出了一种新颖的频率动态卷积(FDConv)方法,旨在解决动态卷积在适应性和参数成本方面的局限性。FDConv通过在傅里叶域中学习固定参数预算,构建频率多样化的权重。实验结果表明,该方法在物体检测、分割和分类任务中表现优越,展现了在现代视觉任务中的灵活性和效率。

Frequency Dynamic Convolution for Dense Image Prediction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z

计算机视觉是人工智能的重要分支,旨在使计算机理解图像和视频。其应用包括微软的Seeing AI,帮助盲人识别环境。核心能力包括图片分类、物体检测和语义分割,广泛应用于医疗、安防和自动驾驶等领域。

计算机视觉

dotNET跨平台
dotNET跨平台 · 2025-03-19T00:01:20Z

本研究提出了一种新方法LED,旨在解决开放词汇物体检测中的偏见和过拟合问题。实验结果表明,该方法利用大型语言模型的隐藏状态,在复杂查询中的性能显著提升。

LED:无须人工策划数据生成的LLM增强开放词汇物体检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z

本研究提出了一种新型稀疏视觉变压器模型SparseFormer,旨在提高高分辨率宽图像中的物体检测准确性和效率。该模型通过选择性注意力标记,结合全局与局部关注,处理尺度变化,并利用非极大抑制算法精确定位物体。实验结果表明,SparseFormer在准确性和速度上显著优于现有方法。

Sparse Transformer: Detecting Objects in High-Resolution Wide Images via Sparse Vision Transformer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出了一种改进的YOLOv8m模型,旨在提高高压输电线路中外部物体检测的准确性。通过增加全球注意力模块和Focal-EIoU损失函数,显著提升了检测效果,增强了安全性。

External Object Detection in High-Voltage Transmission Lines Based on Improved YOLOv8m

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出Mamba架构,解决变压器在物体检测和视频理解中的可扩展性问题。该架构通过状态空间模型实现线性可扩展性和高效处理,增强了上下文意识,对图像和视频理解具有重要影响。

A Review of the Mamba Architecture in Visual Applications

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出了一种新型位置编码方法STRING,克服了大型语言模型中旋转位置编码的局限性。STRING在保持低计算开销的同时,实现了精确的平移不变性,并在视觉变换器中应用,显著提升了开放词汇物体检测和机器人控制的效果。

Learning RoPEs: Enhancing 2D and 3D Positional Encoding with STRING

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z

本研究采用YOLOv7物体检测模型,针对厨房刀具使用中的不安全行为进行检测,成功识别手指位置和刀刃接触手的情况,显示出提升厨房安全的潜力。

YOLOv7在厨房安全中对刀具使用的检测性能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究提出MORDA数据集,旨在帮助物体检测器适应未知的真实目标领域,同时保持在真实源领域的性能。该方法通过合成环境降低数据获取和标注成本,提升自动驾驶汽车在韩国驾驶环境中的检测能力。

MORDA: A Dataset to Facilitate the Adaptation of Object Detectors to Unseen Real-Target Domains While Preserving Performance in Real-Source Domains

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码