METER:用于单目深度估计的移动视觉变换器架构
原文中文,约400字,阅读约需1分钟。发表于: 。深度估计是自主系统评估自身状态和感知周围环境所需的基本知识。本文提出了一种新的轻量级视觉变换器架构 METER,用于嵌入式设备上的单目深度估计,能够在 NVIDIA Jetson TX1 和 NVIDIA Jetson Nano 等受限硬件上实现最先进的估计和低延迟推断性能。
本文提出了两种高效且轻量级的编码器-解码器网络结构,用于实现实时深度估计。这些网络在嵌入式系统上降低了计算复杂性和延迟,并在单个RGB图像上达到了先进深度估计作品的准确性。实验结果表明,这些网络在NVIDIA Jetson Nano和NVIDIA Jetson AGX Orin上具有较快的推断速度,并在KITTI数据集上达到了相对最先进的准确性。