该论文提出了一种基于多摄像头的鸟瞰图像获取方法,利用神经网络进行环境感知,解决了单目摄像头的距离估计问题。研究展示了新框架BEVFormer和BEVerse在自动驾驶任务中的优越性,提升了3D物体检测和运动预测的准确性。此外,介绍了M-BEV框架和RoadBEV模型,显著提高了道路重建的准确性,具有实际应用潜力。
本文介绍了一种利用鸟瞰图像的系统,通过模拟器训练实现零样本转移到真实世界,增强了在真实环境中的鲁棒性,并证明了其有效性,相关代码和数据集已公开。此外,研究了在稀疏交互下生成世界模型的方法,提出了变分稀疏门控的潜在动力学模型,显示出在复杂环境中的优越性能。
完成下面两步后,将自动完成登录并继续当前操作。