本文提出了一种新型自回归模型,作为有效的单目深度估计器,克服了现有方法的局限性。该模型通过不同分辨率的深度图和自回归目标,在KITTI和NYU Depth v2数据集上显著提升了性能,并实现了最佳RMSE,为深度估计提供了新的思路。
本研究提出D$^3$epth方法,通过动态掩膜减少动态物体对深度估计的影响,并引入光谱熵模块以提高准确性。实验结果表明,该方法在KITTI和Cityscapes数据集上优于现有技术,具有重要的应用潜力。
本研究提出了MonoASRH框架,旨在解决单目三维目标检测中的全局意识不足和小目标遗漏问题。通过高效的混合特征聚合和自适应尺度感知回归,实验在KITTI和Waymo数据集上取得了优异的表现。
本研究提出了多种新方法以提升自监督单目深度估计的性能,包括自我关注、离散视差预测和基于Transformer的模型。实验结果表明,这些方法在KITTI和Make3D数据集上超越了现有技术,取得了最佳效果。
本文提出了一种基于可微分的表示变换模块的框架,使得3D物体检测与深度估计的深度神经网络能够在此统一的框架中进行端到端的训练。该框架与大多数目前最先进的神经网络兼容,并在KITTI基于图像的3D物体检测排行榜上获得最高名次。
该研究提出了一种新的增强技术,通过使用被模型预测为假阳性的点云来对模型进行再训练,改善3D对象检测模型的性能。实验结果表明,采用假阳性采样的模型减少了假阳性,并在KITTI和Waymo Open数据集上有了较大的优势。
本文介绍了一种利用三维全卷积网络的学习机制,能够稠密地预测每个三维点的检测分数和描述特征,并通过自监督的检测器损失来指导特征匹配结果。该方法在3DMatch和KITTI数据集上取得了最先进的结果,并在ETH数据集上展现了强大的概括能力,为实现准确快速的点云对齐提供了可靠的特征检测器。
Patch Refinement是一种两阶段的模型,用于准确检测和定位3D对象。在KITTI 3D对象检测基准测试中,它在所有三个难度级别上都优于以前的输入,仅使用了50%的训练数据和LiDAR信息。
本文介绍了一种名为FG-Depth的框架,利用预训练的Flow-Net的先验知识来引导优化,提出了流蒸馏损失和基于先验流的掩模来提高模型性能以及消除噪声。实验结果表明,该方法在KITTI和NYU-Depth-v2数据集上均达到了最领先的效果。
本文提出了一种基于鲁棒学习思想的目标检测框架,通过使用在源领域上训练的检测模型获取目标领域的嘈杂标签数据,从而实现对领域适应问题的处理。通过在SIM10K、Cityscapes和KITTI等数据集上验证,与现有方法相比,本文方法显著提升。
完成下面两步后,将自动完成登录并继续当前操作。