小红花·文摘

该研究提出了多种方法以提高3D视觉定位的准确性，包括2D语义辅助训练、语言引导物体检测和基于多视角变换器的方法。通过引入弱监督学习和密集三维视觉接地网络，研究在不同数据集上展示了显著的性能提升，并探讨了文本引导的三维视觉定位的进展与未来方向。