本文介绍了SPA,一种强调3D空间意识的表征学习框架。通过多视角图像的神经渲染,提升视觉变换器的空间理解能力。研究显示,SPA在多个任务中优于10种先进方法,展现了实际应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。