WaterMono 是一个专注于水下场景深度估计和图像增强的新型框架。通过教师引导的异常掩模和深度信息结合水下成像模型,提升了模型的鲁棒性。研究表明,Transformers 和 CNNs 在深度估计中表现出不同的偏差,MonoFormer 模型在性能上优于其他模型。此外,OmniFusion 流程和 RT-MonoDepth 网络在实时深度估计中也取得了显著成果。
本文提出了两种高效且轻量级的编码器-解码器网络结构,用于实时深度估计。在单个RGB图像上实现更快的推断速度,同时保持准确性。在NVIDIA Jetson Nano上的运行速度为18.4&30.5 FPS,在NVIDIA Jetson AGX Orin上的运行速度为253.0&364.1 FPS,并在KITTI数据集上达到了最先进的准确性。
完成下面两步后,将自动完成登录并继续当前操作。