小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了VISLIX框架,用于验证视觉模型,解决数据切片方法中的挑战,如缺乏图像元数据。VISLIX能够自动生成自然语言洞察,支持用户与数据切片假设的互动测试,从而提升对象检测模型的验证过程。

VISLIX: An Explainable AI Framework for Validating Vision Models through Slice Discovery and Analysis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z

本研究提出了一种新方法,通过领域约束实现神经网络的任务专门化,能够在不增加数据或改变训练方式的情况下,提高图像分类和对象检测的准确度,为动态可配置图像分析系统的发展提供新方向。

通过领域约束实现神经网络任务专门化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-28T00:00:00Z

该研究提出了一种新框架,通过微调开放集对象检测器,整合遥感图像中的对象检测与视觉定位,显著提高了检测效果。

MB-ORES:一种用于遥感中视觉定向的多分支对象推理器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

本研究提出了一种新方法,通过概念对齐解决开放词汇对象检测中的未见类别测试问题,显著提升了COCO和LVIS基准的检测性能与计算效率。

Sampling View Package for Open-Vocabulary Object Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z
在直播流上构建实时对象检测

文章介绍了YOLO(You Only Look Once)对象检测模型,强调其快速、准确和易于实现的特点。作者提供了使用YOLO进行实时对象检测的步骤,包括依赖安装、视频流捕获和边界框绘制,配以简单代码示例,帮助读者快速上手。

在直播流上构建实时对象检测

DEV Community
DEV Community · 2024-11-30T03:14:53Z

本研究提出了“箱子用于掩码”和“掩码用于箱子”两种策略及其结合方式BoMBo,以解决多任务部分监督学习中对象检测与语义分割的信息利用不足问题。实验结果表明,在VOC和COCO数据集上取得了显著提升。

箱子用于掩码,掩码用于箱子:多任务部分监督学习的弱损失

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

本研究提出了一种新型局部-全局注意力机制,解决了对象检测中局部与全局特征平衡不足的问题。该机制结合多尺度卷积与位置编码,动态调整局部与全局注意力的重要性,显著提升了不同尺度对象的检测能力,尤其在多类和小物体检测中表现优异。

Local-Global Attention: An Adaptive Mechanism for Multi-Scale Feature Fusion

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

该研究提出了任务导向自适应调节(T-OAR)机制和任务相关动态提示注入(T-DPI)模块,以解决红外与可见图像融合在多任务处理中的复杂性和性能下降问题。这些方法在对象检测、语义分割和显著性目标检测等任务中表现优异,提升了图像融合的效率与适应性。

Instruction-Driven Fusion of Infrared-Visible Images: Customization for Diverse Downstream Tasks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本研究提出了一种低成本的无监督领域适应方法,有效解决了精细农业中视觉模型在新领域的适应性问题,显著提升了对象检测和关键点检测的精度。

From Network Data to Real-World Scenarios: Low-Cost Unsupervised Domain Adaptation for Agricultural Robots

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本文介绍了掩码自动编码器(MAE)在计算机视觉中的应用,强调其自监督学习能力和高效性。MAE通过统一遮蔽(UM)和轻量级模型EfficientSAMs,在图像分类、对象检测、视频对象跟踪和分割等任务中表现出色,展现了优越的性能和计算效率。

资源高效的多视角感知:将语义遮掩与遮掩自编码器相结合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本文介绍了多种基于事件数据的深度学习方法,包括时空过滤、对象分类、事件定位和数据增强技术。这些方法在动作识别、对象检测和分类方面显著提高了性能,尤其在动态视觉传感器应用中表现突出。同时,研究还提出了新的数据集和基准测试,推动了事件相机技术的发展。

EventAug:用于事件学习的多方面时空数据增强方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

本文介绍了基于文本指导的图像编辑系统Imagen Editor,该系统通过对象检测和高分辨率图像实现文本与图像的高对齐度。研究提出了EditBench基准来评估编辑效果,并展示了多种图像修复方法,如DreamInpainter和LAR-Gen,强调了文本与示例图像结合的优势,从而提升视觉质量和一致性。

通过语义预填充改进文本引导的物体填å

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-12T00:00:00Z

本文综述了深度学习加速器(DLA)和FPGA在卷积神经网络(CNN)中的应用,探讨了设计方法和性能评估。研究表明,FPGA与深度神经网络(DNN)结合设计能显著提升对象检测性能并降低能耗。同时介绍了Edge TPU和脉冲神经网络(SNN)的性能优化技术,强调其在边缘计算中的应用潜力。

高效边缘人工智能:使用Gemmini加速器在FPGA上部署卷积神经网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-14T00:00:00Z

本文介绍了YOLOv8的六大模块,包括分类和对象检测,重点在于使用PT文件进行推理,强调零精度损失和高一致性,适合Python开发环境,支持GPU和CPU切换。提供了简单的代码示例,展示分类和检测推理的实现。

【精度无损】使用YOLOv8 PT原始文件实现推理预测

gloomyfish
gloomyfish · 2024-08-11T02:51:30Z

本文研究了视觉主动学习和不确定性量化在三维环境中的应用,提出了多种深度学习方法以提升对象检测和语义分割的性能。通过智能体与奖励函数的结合,优化了注释请求和模型校准,展示了在自动驾驶等场景中的有效性。

感知的重要性:通过不确定性感知增强具身化人工智能的语义分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-05T00:00:00Z

该论文提出了Bridge3D方法,通过预训练基础模型的特征和语义掩码,提升3D场景表示学习。该方法在3D对象检测和语义分割任务中表现优异,超越了现有技术,展示了视觉基础模型在三维感知中的潜力。

通过 3D 感知的微调改进 2D 特征表示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z

本文提出了一个评估视觉问答(VQA)推理能力的框架,并引入自上而下的校准技术,以提升模型在不完美感知下的推理能力。研究显示,多任务变压器模型在视觉识别和推理方面表现优越,尤其是对象检测对推理的显著帮助。此外,论文还探讨了因果推理在视觉表征学习中的应用及未来研究方向。

退后一步:重新思考视觉推理的两个阶段

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z

本文探讨了Segment Anything Model(SAM)在图像分割和对象检测中的应用,提出了改进方法如SAPNet和GenSAM。研究表明,优化提示和新型适配器使SAM在医学图像分割和视频对象跟踪任务中表现优越,尤其在零样本和开放集分割方面。

SAM-CP:将 SAM 与可组合提示相结合的多功能分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-23T00:00:00Z

该研究提出了一种基于Transformer的模型,能够自动检测图像中的对象并分析注视行为。该方法在目标检测、分类和定位方面表现出显著提升,具有广泛的应用潜力。

OAT: 目标层级注意力变换器用于凝视扫描路径预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

本研究提出了一种利用微调稳定扩散模型生成合成数据集的方法,应用于对象检测模型训练。结果表明,使用合成数据训练的模型在苹果果园检测中表现接近真实数据训练的基线模型,验证了合成数据生成技术的潜力。结合真实与合成数据后,模型的泛化性能显著提高,展示了该技术在视觉任务中的应用前景。

通过实施合成图像数据集创建流程进行视觉汽车品牌分类

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-03T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码