本研究提出了一种基于单张环境图像的多智能体架构,解决了大型语言模型和视觉语言模型在融合多模态信息时表现不佳的问题。通过利用常识知识进行自由形式域的处理,并引入新的评估程序PG2S,该方法在评估规划质量方面优于现有的KAS指标。
完成下面两步后,将自动完成登录并继续当前操作。