本文介绍了一种从2D视觉观察中学习动态3D场景模型的方法,结合神经放射场、时间对比学习和自动编码框架,可以学习到视点不变的3D感知场景表示,支持视觉运动控制和未来预测,并支持摄影机视点外训练分布的目标规定。同时,还对不同系统设计进行了详细的改变研究和学习的表示的定性分析。
完成下面两步后,将自动完成登录并继续当前操作。