Plain-Det:同时支持多数据集训练的新目标检测 | ECCV'24 - 晓飞的算法工程笔记
原文中文,约8900字,阅读约需22分钟。发表于: 。近期在大规模基础模型上的进展引发了对训练高效大型视觉模型的广泛关注。一个普遍的共识是必须聚合大量高质量的带注释数据。然而,鉴于计算机视觉中密集任务(如目标检测和分割)标注的固有挑战,实际的策略是结合并利用所有可用的数据进行训练。 论文提出了Plain-Det,提供了灵活性以适应新的数据集,具有跨多样
近期,Plain-Det结合Def-DETR在COCO数据集上取得51.9的mAP,展示了出色的泛化能力。通过共享检测器和语义空间,解决多数据集训练的挑战,并引入语义空间校准、稀疏查询和动态采样策略,提高训练效率和性能。该方法在多个数据集上创造了新的最佳结果,表现出良好的鲁棒性和兼容性。