本研究提出了COUNTS,一个大规模的OOD数据集,旨在评估目标检测器和多模态大语言模型在分布变化下的泛化能力。研究表明,尽管大模型在标准数据集上表现良好,但在OOD场景中仍存在显著的性能限制。
现代目标检测器中普遍出现任务不协调问题,影响检测器性能。本文提出了一种用于目标检测的协调量化方法(HQOD),包含任务相关损失和协调的对交并比损失。HQOD 可以轻松集成到不同的量化训练算法和检测器中。在 MS COCO 数据集上,我们的模型实现了 39.6% 的最新平均精度(mAP),超过了完全精度模型的性能。
本论文介绍了一种名为ScaleDet的可扩展多数据集目标检测器,通过增加训练数据集来提高其跨数据集的泛化能力。ScaleDet使用简单且可扩展的公式来统一多个数据集的标签空间,并通过视觉文本对齐进行训练。实验证明,ScaleDet在多个数据集上表现出良好的性能和可扩展性。
该文章介绍了半监督领域通用目标检测(SS-DGOD)和弱监督领域通用目标检测(WS-DGOD)两种新的问题设置,利用师生学习框架在有限的标记数据和多个无标记或弱标记数据进行训练。研究结果表明,训练的目标检测器在此设置下明显优于基线检测器,并且与无监督领域自适应(UDA)设置下训练的目标检测器性能相媲美或更好,同时不需要使用目标领域数据进行训练。
该论文提出了一种通用的多视角黑盒攻击方法,通过优化构建的通用对抗性UV纹理来欺骗目标检测器。实验结果显示,在多视角情景下,检测性能平均降低了74.29%。同时,还设计了一种基于逼真模拟器的评估工具,用于公平评估基于纹理的攻击。
本文介绍了一种新的方法来增强目标检测器的能力,通过在生成的合成数据集中训练扩散模型,并将实例级别的定位引导器集成到模型中,可以提高目标检测器的性能。实验结果显示,使用这种方法训练的目标检测器在开放词汇和数据稀缺情景中表现出比现有方法更好的性能。
本文介绍了一种新的方法来增强目标检测器的能力,通过在合成数据集中训练扩散模型并引入实例级别的定位引导器,提高了目标检测器的性能。实验结果显示,使用该方法训练的目标检测器在开放词汇和数据稀缺情景中表现更好。
本研究评估了适用于电动滑板车的目标检测器的效果和效率,并建立了全面的基准。研究发现YOLOv3-tiny等模型在实时目标检测方面表现出潜力。研究的数据集和代码对提高电动滑板车的安全性和定制解决方案有帮助。
通过检查COCO(2017版本)中的掩膜,发现错误并开发了COCO-ReM数据集,该数据集具有更清晰、质量更好的掩膜。评估了50个目标检测器,发现在COCO-ReM上得分更高的模型预测效果更好,训练模型收敛更快,得分更高,强调了数据质量对目标检测器的重要性。建议未来的目标检测研究使用COCO-ReM数据集。
本文介绍了一种可插拔的多模态融合方法M2Doc,用于文档版面分析任务。M2Doc包含两个融合模块,可以将文本和视觉特征融合。实验结果显示使用M2Doc的目标检测器在版面分析数据集上取得了显著提升。该方法在复杂逻辑版面分析场景中能感知文本内容和语义。未来的研究方向包括设计统一高效的多模态模型和更有效的多模态融合策略。
该文章介绍了半监督领域通用目标检测(SS-DGOD)和弱监督领域通用目标检测(WS-DGOD)两种新的问题设置,利用师生学习框架在有限的标记数据和多个无标记或弱标记数据进行训练。研究结果显示,训练的目标检测器在此设置下明显优于基线检测器,并且与无监督领域自适应(UDA)设置下训练的目标检测器性能相媲美或更好,同时无需使用目标领域数据进行训练。
该文研究了基于Transformer的目标检测器(DETR)在处理遮挡和对抗扰动等不同图像干扰方面存在的问题。通过多种实验和基准测试,发现DETR在处理遮挡图像的信息丢失干扰方面表现良好,但在涂有对抗标记的图像上表现较差。此外,DETR在进行预测时严重依赖于主要查询,导致查询之间的贡献不平衡。
该文研究了基于Transformer的目标检测器(DETR)在处理遮挡和对抗扰动等不同图像干扰方面存在的问题。实验发现DETR在处理遮挡图像的信息丢失干扰方面表现良好,但在涂有对抗标记的图像上表现较差。此外,DETR在预测时严重依赖于主要查询,导致查询之间的贡献不平衡。
本研究评估了三种模型在遥感图像中太阳能电池板识别方面的监督水平,包括目标检测器、弱监督分类器和异常检测器。分类器表现出色,目标检测器提供了精确的定位。模型结果的融合显示出潜在的准确度提升。
本文介绍了使用在线多目标追踪器和现代目标检测器对SoccerNet 2023跟踪挑战进行球员和球的追踪任务,并使用插值和无外观的轨迹合并进行后处理。该方法获得了第三名,HOTA得分为66.27。
本文介绍了对SoccerNet 2023跟踪挑战的解决方案,包括球员和球的追踪任务。使用了在线多目标追踪器和现代目标检测器进行球员追踪,并引入插值和无外观的轨迹合并进行后处理。同时,使用基于外观的轨迹合并技术处理远离图像边界的轨迹的终止和创建。球的追踪形式化为单个目标检测,借助经过微调的YOLOv8l检测器和专有的过滤器提高检测精度。在SoccerNet 2023跟踪挑战中获得第三名,HOTA得分为66.27。
本文提出了一种处理含有混合标签噪声和边界框噪声的目标检测器训练框架,通过交替噪声校正和模型训练来优化目标标签、边界框坐标和模型参数。在PASCAL VOC和MS-COCO数据集上实验结果良好。
完成下面两步后,将自动完成登录并继续当前操作。