本研究提出LOMA网络,解决了3D占用预测中的几何信息不足和局部交互受限的问题。通过VL感知场景生成器和三平面融合Mamba模块,有效融合视觉与语言特征,实现高效的3D语义占用预测,实验结果表明在几何和语义补全任务上表现优异。
完成下面两步后,将自动完成登录并继续当前操作。