该文介绍了一种名为EMR-MSF的模型,通过监督学习范围内的网络架构设计,在两个时间连续的单目图像中理解三维结构和三维运动,并进一步通过相机运动聚合模块塑造出显式和强健的几何约束。该方法在KITTI场景流基准中将自监督单目方法的SF-all指标提高了44%,并在深度和视觉里程计等子任务以及其他自监督单一任务或多任务方法中展现出卓越的性能。
完成下面两步后,将自动完成登录并继续当前操作。