本研究探讨了人类与大型语言模型(LLM)代理在竞争合作中的互动行为。通过分析30名参与者在囚徒困境游戏中的表现,发现代理特征显著影响人类的合作行为,并揭示了性别与代理特征的交互作用,为人机合作提供了新视角。
本研究提出了一种语言指导偏好学习(LGPL)方法,旨在优化机器人在社会环境中的互动行为。该方法结合了预训练语言模型与偏好学习,仅需四个查询即可快速学习并准确执行行为,显著提高了样本效率。
完成下面两步后,将自动完成登录并继续当前操作。