小红花·文摘

本文介绍了一种从2D视觉观察中学习动态3D场景模型的方法，结合神经放射场、时间对比学习和自动编码框架，可以学习到视点不变的3D感知场景表示，支持视觉运动控制和未来预测，并支持摄影机视点外训练分布的目标规定。同时，还对不同系统设计进行了详细的改变研究和学习的表示的定性分析。