小红花·文摘

使用TensorFlow和PyCharm为Reachy Mini构建实时物体检测应用

The JetBrains Blog ·

Ultralytics创始人Glenn Jocher将在OSCCA大会上发表演讲

OpenCV ·

07-HarmonyOS5-物体检测案例

DEV Community ·

本研究利用Instruct Pix2Pix扩散模型生成天气基数据集，以增强自动驾驶物体检测系统在恶劣天气下的鲁棒性和识别能力。

恶劣天气条件下用于自动驾驶汽车的物体检测：基于Instruct Pix2Pix的方法

BriefGPT - AI 论文速递 ·

本研究分析了全无人商店中人工智能自动结算系统的安全漏洞，揭示了对抗性补丁攻击对物体检测模型的影响，可能导致盗窃和库存差异。提出了新型损失函数和攻效度量，强调了提升防御策略的必要性。

Robustness Analysis against Adversarial Patch Attacks in Fully Unmanned Stores

BriefGPT - AI 论文速递 ·

使用Python掌握计算机视觉基础

DEV Community ·

超越YOLO：实现D-FINE物体检测以获得更高精度

DEV Community ·

Perception-R1是由多所高校联合开发的多模态大语言模型，首次在COCO2017验证集上实现30AP，超越YOLOv3等模型。该模型通过强化学习优化视觉感知策略，提升了物体检测、计数和OCR等任务的能力，为AI视觉感知的未来奠定基础。

用多模态LLM超越YOLOv3！强化学习突破多模态感知极限｜开源

量子位 ·

本研究提出了一种合成数据增强流程，以模拟自主驾驶中的传感器故障，旨在提高物体检测和跟踪的鲁棒性。通过训练轻量级噪声识别神经网络，识别准确率达到54.4%，从而提升自动驾驶系统的稳定性和可靠性。

Synthesis and Identification of Noise Levels in Autonomous Vehicle Camera Radar Datasets

BriefGPT - AI 论文速递 ·

探讨物体定位与物体检测的关键区别

DEV Community ·

本文介绍了一种专为10-12岁上肢残疾儿童设计的人工智能视觉辅助假手，具有仿生外观和多关节功能，旨在为低收入家庭提供经济实惠的解决方案。该假手通过3D打印和机器视觉实现高效的物体检测与抓取分类。

Visual-Aided Prosthetic Hand for Upper Limb Disabled Children

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的变接收场DETR（VRF-DETR）方法，旨在解决无人机空中物体检测中的低于10像素目标、密集遮挡和计算限制等问题。该方法通过多尺度上下文融合和门控卷积等技术，提高了检测的准确性和效率，并在VisDrone2019数据集上取得了优异表现。

Efficient Aerial Image Detection with Variable Receptive Fields

BriefGPT - AI 论文速递 ·

Adirik在Replicate上发布的Grounding-Dino模型初学者指南

DEV Community ·

本研究提出了一种新颖的频率动态卷积（FDConv）方法，旨在解决动态卷积在适应性和参数成本方面的局限性。FDConv通过在傅里叶域中学习固定参数预算，构建频率多样化的权重。实验结果表明，该方法在物体检测、分割和分类任务中表现优越，展现了在现代视觉任务中的灵活性和效率。

Frequency Dynamic Convolution for Dense Image Prediction

BriefGPT - AI 论文速递 ·

计算机视觉是人工智能的重要分支，旨在使计算机理解图像和视频。其应用包括微软的Seeing AI，帮助盲人识别环境。核心能力包括图片分类、物体检测和语义分割，广泛应用于医疗、安防和自动驾驶等领域。

计算机视觉

dotNET跨平台 ·

本研究提出了一种新方法LED，旨在解决开放词汇物体检测中的偏见和过拟合问题。实验结果表明，该方法利用大型语言模型的隐藏状态，在复杂查询中的性能显著提升。

LED：无须人工策划数据生成的LLM增强开放词汇物体检测

BriefGPT - AI 论文速递 ·

本研究提出了一种新型稀疏视觉变压器模型SparseFormer，旨在提高高分辨率宽图像中的物体检测准确性和效率。该模型通过选择性注意力标记，结合全局与局部关注，处理尺度变化，并利用非极大抑制算法精确定位物体。实验结果表明，SparseFormer在准确性和速度上显著优于现有方法。

Sparse Transformer: Detecting Objects in High-Resolution Wide Images via Sparse Vision Transformer

BriefGPT - AI 论文速递 ·

本研究提出了一种改进的YOLOv8m模型，旨在提高高压输电线路中外部物体检测的准确性。通过增加全球注意力模块和Focal-EIoU损失函数，显著提升了检测效果，增强了安全性。

External Object Detection in High-Voltage Transmission Lines Based on Improved YOLOv8m

BriefGPT - AI 论文速递 ·

本研究提出Mamba架构，解决变压器在物体检测和视频理解中的可扩展性问题。该架构通过状态空间模型实现线性可扩展性和高效处理，增强了上下文意识，对图像和视频理解具有重要影响。

A Review of the Mamba Architecture in Visual Applications

BriefGPT - AI 论文速递 ·

本研究提出了一种新型位置编码方法STRING，克服了大型语言模型中旋转位置编码的局限性。STRING在保持低计算开销的同时，实现了精确的平移不变性，并在视觉变换器中应用，显著提升了开放词汇物体检测和机器人控制的效果。

Learning RoPEs: Enhancing 2D and 3D Positional Encoding with STRING

BriefGPT - AI 论文速递 ·