UMono: 物理模型引导的混合 CNN-Transformer 框架用于水下单目深度估计

提出了一种针对水下单目深度估计的端到端学习框架 UMono，该框架将水下图像形成模型特征纳入网络架构，并有效利用水下图像的局部和全局特征，实验证明该方法在水下单目深度估计方面具有良好的效果，并在定量和定性分析中优于现有方法。

本文介绍了两种高效且轻量级的编码器-解码器网络结构，用于实时深度估计。这些网络在嵌入式系统上具有较低的计算复杂性和延迟，并且在单个RGB图像上能够达到先进深度估计作品的准确性。

cnn transformer 准确性单目实时深度估计嵌入式系统编码器-解码器网络结构计算复杂性