本研究提出自我发现学习方法,以解决自动驾驶系统对人类驾驶行为理解不足的问题,改善样本不均衡,提高驾驶行为检测准确性,增强系统智能与安全性。
该研究聚焦于人-物交互检测,提出了解耦三元组预测和Disentangled Transformer等新方法,显著提升了HICO-DET和V-COCO数据集上的检测性能。通过结合强弱监督数据和视觉语言模型,研究有效解决了样本不均衡问题,并在零样本学习中表现优异。
本文提出了一种改进的FSOD模型来解决样本不均衡和特征传播不足的问题。通过解耦基类和少样本类的参数以及引入编码器和解码器之间的跳跃连接,构建一个统一解码器模块,能够动态融合解码器的中间层作为输出特征。实验结果显示,在PASCAL VOC和MSCOCO等常用数据集上,我们的模型在微调和元学习范式中稳定提升了5%到10%,并且超过了近期工作的最高得分。
完成下面两步后,将自动完成登录并继续当前操作。