HyperAI超神经 ·

LLMs 玩狼人杀：清华大学验证大模型参与复杂交流博弈游戏的能力

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

清华大学研究团队提出了一种用于交流游戏的框架，展示了大语言模型从经验中学习的能力，发现大语言模型具有非预编程的策略行为。研究人员使用狼人杀游戏进行实验，发现经验池对提高平民方的胜率和游戏持续时间有积极影响。谷歌AI也发布了掌握41款游戏的AI Agent。

🎯

关键要点

清华大学研究团队提出了一种用于交流游戏的框架，展示了大语言模型从经验中学习的能力。
研究发现大语言模型具有非预编程的策略行为，如信任、对抗、伪装和领导力。
AI在狼人杀等复杂博弈游戏中需要从模糊的自然语言中推断信息，具有实际价值和挑战。
研究团队使用7名玩家进行狼人杀实验，展示了AI Agent的自主学习能力。
框架包括生成响应的提示、游戏规则、角色能力和经验知识等四个主要部分。
研究提出非参数学习机制，使语言模型无需调整参数即可学习经验。
经验池的大小对AI Agent的表现有显著影响，使用历史经验可以提高平民方的胜率。
实验结果表明，使用10或20轮历史经验时，平民方的胜率和游戏持续时间都有显著提高。
AI Agent在游戏中展现出信任、对抗、伪装和领导等策略行为，类似于人类行为。
谷歌AI发布了一个掌握41款游戏的多游戏智能体，显示出在多任务学习上的巨大进展。

🏷️

标签

大模型大语言模型清华大学游戏游戏框架狼人杀游戏谷歌AI

➡️

继续阅读

因为全流程少于两小时，这款游戏Steam被退款5.5万份
“好游戏，1小时40分钟打完（已退款）。”去年夏天有一个挺火的双人游戏《划划划》，游戏是由两个玩家操作船桨，让船顺利通过一些变态难度、过于让人受挫的关卡。...
送了几百款游戏的“E宝”，还想继续和玩家做朋友
一个社区运营者的职业转折。我第一次见到以太，是在中国音数协游戏博物馆的一次交流里。那天，我们聊了很久游戏收藏，从老主机到中古盒装游戏，他对这些东西如数家珍...
猫抓 2.7.1 更新，持续增强 m3u8 下载能力｜猫抓是什么？
猫抓（cat-catch）是一款浏览器扩展，用来下载在线视频，包含绝大多数可以在浏览器中直接播放的视频，用起来非常简单。@Appinn 最近猫抓 2.7....
🔍 别让大模型"想太多"：SKILL开发中的语义陷阱与抗幻觉设计
2026 07 20 HackerNews
2026-07-20 Hacker News Top Stories # 阿里巴巴将开源2400亿参数Qwen 3.8模型，预览版已上线并与竞争...
AI 内存别只当概念看：它其实是状态管理问题
阮一峰周刊提到 AI 内存这个话题。比起把它看成模型能力，我更关心它在真实系统里的状态管理、隔离、回滚和观测问题。AI 应用想记住用户，先要能解释、能删除、能排查。