浙江工业大学推出Distill-Any-Depth项目,通过蒸馏算法整合多个模型,仅需2万张无标签图像即可实现高精度的单目深度估计,显著降低数据标注成本,广泛应用于自动驾驶等领域。
本研究提出了Jasmine框架,针对单目深度估计中的自监督学习,解决了深度信息模糊和伪影问题。通过混合图像重建任务和Scale-Shift GRU,显著提高了深度估计的清晰度和泛化能力。实验结果表明,Jasmine在KITTI基准测试中表现优异。
AIxiv专栏促进学术交流,字节跳动AR团队与豆包大模型团队联合开发的Video Depth Anything(VDA)解决了单目深度估计在视频中的一致性问题。VDA在精度、速度和稳定性上刷新了SOTA,尤其在长视频处理上表现优异,推理速度可达30FPS,已公开并受到广泛关注。
本研究探讨了单目深度估计中的不确定性量化问题,提出将五种不确定性量化方法与DepthAnythingV2模型结合。通过高斯负对数似然损失微调,研究实现了在保持预测性能的同时,提供可靠的不确定性估计,为机器视觉系统的安全应用奠定基础。
本文提出了SharpDepth,一种新颖的单目深度估计方法,解决了传统模型生成深度图过于平滑的问题。SharpDepth在深度估计基准上表现优异,兼顾度量准确性与边界保留,展现出高质量的深度感知潜力。
本文提出了一种新型自回归模型,作为有效的单目深度估计器,克服了现有方法的局限性。该模型通过不同分辨率的深度图和自回归目标,在KITTI和NYU Depth v2数据集上显著提升了性能,并实现了最佳RMSE,为深度估计提供了新的思路。
本文提出了一种新的稳定对抗训练框架SCAT,以提高自监督单目深度估计模型的泛化能力。通过对抗数据增强和优化网络结构,实验结果表明该方法在五个基准测试中表现优异,显著提升了自监督深度估计的性能。
本文提出了一种新型自监督单目深度估计框架,利用反向循环模型和信息蒸馏策略,在KITTI基准测试中表现优异。研究了如何运用语义结构指导几何表示学习,提出了基于预训练语义分割网络的架构,克服动态对象的语义偏差。该方法在多个数据集上验证了其高精度和泛化性能,适用于自主车辆环境分析等关键应用。
本研究提出了多种新方法以提升自监督单目深度估计的性能,包括自我关注、离散视差预测和基于Transformer的模型。实验结果表明,这些方法在KITTI和Make3D数据集上超越了现有技术,取得了最佳效果。
本文提出了一种基于自监督学习的单目深度估计框架,通过结合深度和颜色信息来提高深度去噪效果。研究表明,该框架在KITTI基准测试中表现优异,超越了传统方法,显著提升了深度预测的精度和性能。
研究提出了一种新方法,通过单应性估计和目标检测,收集多视角道路数据,解决单目深度估计在视角变化下的不足。实验显示,该方法在深度和不确定性上有显著提升,对自动驾驶等应用有重要意义。
本文探讨了单目深度估计的最新进展,提出了半监督学习、数据增强和可学习提示等方法,显著提升了模型性能。研究表明,结合自然语言指导可以改善深度估计,但在鲁棒性和泛化性方面仍面临挑战。
本文探讨了单目深度估计神经网络在对抗攻击下的鲁棒性,实验表明微小扰动会显著影响深度估计。研究提出了一种新方法以增强攻击效果,并评估了不同攻击对模型的影响,强调了在自动驾驶等应用中的安全隐患。此外,研究还提出了自监督对抗训练方法,以提高模型对真实世界攻击的鲁棒性。
该研究提出了一种通用的单目深度估计模型,能够在多种任务中实现高精度结果。通过多目标学习和不同数据集的结合,显著提高了训练效果,并探讨了恶劣条件下的深度估计不可靠性,提出了有效解决方案。实验结果显示,该方法在多个公共数据集上优于现有技术。
本研究提出了一种基于稳定扩散的单目深度估计方法Marigold,利用生成模型的先验知识,在多个数据集上实现了先进性能。通过自监督框架MonoDiffusion和生成网络,解决了深度数据不足的问题,并在KITTI和Make3D数据集上表现优异。此外,ZeroDepth框架在不同域和相机参数下也取得了最佳成果,显著提升了深度估计的准确性。
本文提出了一种新算法,通过单目深度估计网络和激光雷达点云的互信息,实现相机与激光雷达的自动外参校准,无需训练数据和人工干预。该方法在多种场景中表现出良好的适应性和鲁棒性,适用于智能汽车等领域,并生成了新的数据集用于性能测试,展示了算法的准确性和效率。
本文提出了一种针对深度学习单目深度估计系统的对抗攻击方法,利用隐蔽补丁在实际驾驶场景中实现93%的攻击成功率和超过6米的深度估计误差。研究表明,MDE系统对恶意补丁存在脆弱性,需开发更强的防御机制。同时,提出基于视图合成的自监督对抗训练方法,以增强模型的鲁棒性。
本文介绍了多种单目深度估计方法,如ZeroDepth、SC-Depth和M^2Depth。这些方法通过几何一致性损失、自我发现掩码和多摄像头输入等技术,提高了深度估计的准确性和一致性,尤其在KITTI和NYUv2数据集上表现优异。这些新模型在不同场景下有效应用,推动了深度估计技术的发展。
该研究提出了一种新方法“Stealing Stable Diffusion (SSD) prior”,旨在提高单目深度估计在复杂环境中的可靠性。通过生成合成图像和自我训练机制,结合DINOv2编码器,增强了模型的深度估计能力。评估结果表明,该方法在nuScenes和Oxford RobotCar数据集上表现良好。
本文提出了一种基于自监督深层模型的单目深度估计框架,结合深度估计网络优化和信息蒸馏策略,在KITTI基准测试中表现优异。研究还开发了双像素模型和深度去模糊网络,提升了深度估计的准确性和成像质量。实验结果表明,该方法在多个数据集上具有竞争力。
完成下面两步后,将自动完成登录并继续当前操作。