我想要自由!大语言模型在社交等级下的反社会行为和说服能力
原文中文,约500字,阅读约需1分钟。发表于: 。本研究针对大语言模型(LLM)在多代理环境中相互作用的复杂性,特别是在严格的社会层次结构下的行为模式进行了深入探讨。通过模拟“监狱实验”的情境,发现模型在权力动态下的对话效果不一,并指出了目标设定对说服力的影响以及角色分配如何引发反社会行为。这些发现为大语言模型代理的发展及其社会影响的讨论提供了重要见解。
研究分析了大型语言模型Llama2在迭代囚徒困境中的合作行为。通过100轮游戏模拟,评估其对游戏规则的理解和决策能力。结果表明,Llama2倾向于不主动背叛,并在对手背叛率低于30%时采取谨慎合作策略,显示出较强的合作倾向。此研究为LLM在博弈理论中的应用提供了新思路,帮助指导其审核和对齐实践。