本文介绍了多种3D大型语言模型(3D-LLMs),如Chat-3D、LL3DA和Scene-LLM,强调它们在3D场景理解、问答和交互规划中的应用与优势。这些模型结合了3D点云和语言处理能力,显著提升了对复杂3D环境的理解和互动能力,推动了3D视觉理解领域的发展。
完成下面两步后,将自动完成登录并继续当前操作。