小红花·文摘

研究评估了基于大型语言模型的多智能体协作文本游戏中的理论推理任务。发现智能体表现出紧密合作行为和高级理论推理能力，但存在规划优化限制。通过显式信念状态表示，改善了智能体的任务表现和理论推理准确性。