本研究提出DenseVLM框架,旨在解决预训练视觉语言模型在密集预测任务中的不足,通过无监督区域语言对齐技术克服前景偏差,从而显著提升目标检测和图像分割的性能。
本研究提出了UniHOI模型,旨在解决自我中心手物体交互视频中的密集点云序列重建问题。该模型通过大规模单目视频数据集进行训练,克服了标记数据稀缺的限制,显著提升了点云重建和三维场景流恢复的效果。
本文介绍了两种动态滤波方法(DMNR和DMNR-H),通过准确分析WADS和DENSE数据集上的杂点和干净点的位置和强度,提高了在恶劣气候条件下检测系统的性能。这两种方法优于传统的无监督方法,稍胜于基于深度学习的监督方法,并且对于不同的LiDAR传感器和飞行物(如雪和雾)更为鲁棒。
完成下面两步后,将自动完成登录并继续当前操作。