小红花·文摘

本文评估了大型语言模型在多智能体协作文本游戏中的理论推理任务，发现其在合作和推理能力上表现优异，但在长期规划和任务状态管理上存在限制。通过显式信念状态表示，改善了智能体的表现和推理准确性，并探讨了大型语言模型在理解机器生成行为和意念理论方面的应用，提出了提升性能的新方法。