小红花·文摘

本文介绍了多种3D大型语言模型（3D-LLMs），如Chat-3D、LL3DA和Scene-LLM，强调它们在3D场景理解、问答和交互规划中的应用与优势。这些模型结合了3D点云和语言处理能力，显著提升了对复杂3D环境的理解和互动能力，推动了3D视觉理解领域的发展。