浙江工业大学推出Distill-Any-Depth项目,通过蒸馏算法整合多个模型,仅需2万张无标签图像即可实现高精度的单目深度估计,显著降低数据标注成本,广泛应用于自动驾驶等领域。
本研究提出了Jasmine框架,针对单目深度估计中的自监督学习,解决了深度信息模糊和伪影问题。通过混合图像重建任务和Scale-Shift GRU,显著提高了深度估计的清晰度和泛化能力。实验结果表明,Jasmine在KITTI基准测试中表现优异。
AIxiv专栏促进学术交流,字节跳动AR团队与豆包大模型团队联合开发的Video Depth Anything(VDA)解决了单目深度估计在视频中的一致性问题。VDA在精度、速度和稳定性上刷新了SOTA,尤其在长视频处理上表现优异,推理速度可达30FPS,已公开并受到广泛关注。
本研究探讨了单目深度估计中的不确定性量化问题,提出将五种不确定性量化方法与DepthAnythingV2模型结合。通过高斯负对数似然损失微调,研究实现了在保持预测性能的同时,提供可靠的不确定性估计,为机器视觉系统的安全应用奠定基础。
本文提出了SharpDepth,一种新颖的单目深度估计方法,解决了传统模型生成深度图过于平滑的问题。SharpDepth在深度估计基准上表现优异,兼顾度量准确性与边界保留,展现出高质量的深度感知潜力。
本文提出了一种新型自回归模型,作为有效的单目深度估计器,克服了现有方法的局限性。该模型通过不同分辨率的深度图和自回归目标,在KITTI和NYU Depth v2数据集上显著提升了性能,并实现了最佳RMSE,为深度估计提供了新的思路。
本研究针对单目深度估计的鲁棒性问题,提出了一种结构中心的解决方案。通过引入语义专家模型和可学习同构图,提升了模型在复杂场景中的鲁棒性,并在多个恶劣场景数据集上取得了优异表现。
研究提出了一种新方法,通过单应性估计和目标检测,收集多视角道路数据,解决单目深度估计在视角变化下的不足。实验显示,该方法在深度和不确定性上有显著提升,对自动驾驶等应用有重要意义。
本研究解决了结肠镜视频中单目深度估计面临的合成数据与实际临床数据之间的域差距问题,并提出了一种结构保持的合成到真实图像翻译通用流程,以提高深度估计的泛化能力。研究结果表明,翻译后的图像在保持深度几何特征的同时具有较高的真实性,有助于提升下游深度估计任务的表现。
本文介绍了单目深度估计方法在恶劣照明和天气条件下的不可靠性,并介绍了md4all解决方案。该解决方案在逆境和理想条件下以及不同类型的学习监督下都能可靠工作。实验证明该技术在nuScenes和Oxford RobotCar数据集上都优于先前的工作。
该文章介绍了一种基于物理驱动的深度学习框架,用于单目深度估计。该框架通过假设3D场景由分段平面组成,提出了一种新的方法来推导每个位置的深度。实验证明该方法在多个数据集上超过了现有的竞争方法,并在KITTI深度预测在线基准测试中排名第一。
提出了一种自我监督的基于事件感知的单目深度估计框架EMoDepth,利用跨模态一致性约束训练过程,并仅使用事件进行单目深度预测。实验证明了方法的有效性和精度超过现有方法。
提出了一种自我监督的基于事件感知的单目深度估计框架EMoDepth,通过跨模态一致性约束训练过程,仅使用事件进行单目深度预测,并设计了多尺度跳跃连接架构以融合特征并保持高推理速度。实验证明了方法的有效性,并超过了现有的有监督和无监督方法。
本研究通过训练紧凑的卷积解码器和微小可学习的嵌入矩阵,将视觉-语言基础模型的先验知识推广到学习预训练期间具有挑战性的领域,提高了单目深度估计的性能,并通过实验证明了所提出的方法的有效性。
本文提出了一种使用立体匹配网络作为代理从合成数据中学习深度并使用预测的立体视差图来监督单目深度估计网络的方法,并提出了不同的策略以确保学习到的深度感知能力在不同领域之间得到很好的转移。该方法在KITTI数据集上具有最先进的单目深度估计结果。
本文提出了一种新型的物理推动深度学习框架,用于单目深度估计和补全任务。该方法通过估计表面法线和距离图,并规范化转换为深度图。实验证明,该方法优于先前的方法。
该文介绍了一种基于物理驱动的深度学习框架,用于单目深度估计。该框架假设3D场景由分段平面组成,提出了一种新的正常-距离头来推导每个位置的深度,并引入了额外的深度头来改善框架的鲁棒性。实验证明该方法在多个数据集上超过了现有的最先进竞争方法,并在KITTI深度预测在线基准测试中排名第一。
该文介绍了一种通过少样本学习方法来适应视觉语言模型进行单目深度估计的方法,并通过引入可学习的提示来改善性能。实验证明该方法在 MARE 方面的性能超过了之前的最先进方法 10.6%。
该文介绍了一种基于物理驱动的深度学习框架,用于单目深度估计。该框架通过假设3D场景由分段平面组成,提出了一种新的正常-距离头来推导每个位置的深度,并引入了额外的深度头来改善框架的鲁棒性。实验证明该方法在多个数据集上超过了现有的最先进竞争方法,并在KITTI深度预测在线基准测试中排名第一。
完成下面两步后,将自动完成登录并继续当前操作。