训练单目深度估计模型中 NaN 发散的分析
原文中文,约300字,阅读约需1分钟。发表于: 。训练单眼深度估计网络时,出现 NaN 损失会扰乱梯度下降优化。本研究对 NaN 损失进行了深入分析,并确定了三种导致 NaN 损失的漏洞:1)使用平方根损失导致梯度不稳定;2)对数 Sigmoid 函数存在数值稳定问题;3)某些方差实现导致计算错误。此外,针对每一种漏洞,演示了 NaN 损失的出现,并提供了防止 NaN 损失的实用指南。实验证明,遵循我们的指南可以提高优化稳定性和单眼深度估计的性能。
该文介绍了一种基于物理驱动的深度学习框架,用于单目深度估计。该框架假设3D场景由分段平面组成,提出了一种新的正常-距离头来推导每个位置的深度,并引入了额外的深度头来改善框架的鲁棒性。实验证明该方法在多个数据集上超过了现有的最先进竞争方法,并在KITTI深度预测在线基准测试中排名第一。