本文研究了在V3Det数据集上进行的开放词汇视觉检测任务,提出了多种改进方法,包括网络结构调整和训练策略设计,取得了优异的检测效果。新数据集V3Det为目标检测提供了丰富的边界框和类别层次,推动了开放词汇检测的发展。
我们在 V3Det 数据集上对监督式大规模词汇视觉检测任务进行了研究,通过调整网络结构、改变损失函数和设计训练策略等一系列改进,我们的模型在 V3Det Challenge 2024 的大规模目标检测 (Supervised) 任务和 Open Vocabulary Object Detection (OVD) 任务中取得了出色的排名。
该研究介绍了多个物体跟踪数据集和基准,包括TrackingNet、LaSOT和TLP,评估了多种跟踪器的性能,指出野外物体跟踪领域仍有显著改进空间,并提出了新的开放词汇跟踪器OVTrack和物体检测数据集V3Det,以促进研究进展。
完成下面两步后,将自动完成登录并继续当前操作。