小红花·文摘

介绍了Scene-LLM，一种增强3D室内环境中具有交互能力的具身化智能体的3D视觉语言模型。该模型整合了大型语言模型（LLM）的推理能力，采用混合的3D视觉特征表示方法，并支持场景状态更新。通过实验证明了Scene-LLM在密集字幕生成、问题回答和交互规划方面的强大能力。

BriefGPT - AI 论文速递 ·

介绍了Scene-LLM，一种增强3D室内环境中具有交互能力的智能体的3D视觉语言模型。该模型整合了大型语言模型（LLM）的推理能力，采用混合的3D视觉特征表示方法，并支持场景状态更新。实验证明了Scene-LLM在密集字幕生成、问题回答和交互规划方面的强大能力。

BriefGPT - AI 论文速递 ·

介绍了Scene-LLM，一种增强3D室内环境中具有交互能力的具身化智能体的3D视觉语言模型。该模型整合了大型语言模型的推理能力，采用混合的3D视觉特征表示方法，并支持场景状态更新。通过实验证明了其在密集字幕生成、问题回答和交互规划方面的强大能力。

BriefGPT - AI 论文速递 ·