小红花·文摘

研究分析了大型语言模型Llama2在迭代囚徒困境中的合作行为。通过100轮游戏模拟，评估其对游戏规则的理解和决策能力。结果表明，Llama2倾向于不主动背叛，并在对手背叛率低于30%时采取谨慎合作策略，显示出较强的合作倾向。此研究为LLM在博弈理论中的应用提供了新思路，帮助指导其审核和对齐实践。