机器之心 ·

哪家AI能成卧底之王？淘天技术团队发布多智能体博弈游戏平台WiS

💡 原文中文，约4300字，阅读约需11分钟。

📝

内容提要

AIxiv专栏促进学术交流，报道超过2000篇内容。WiS平台基于“谁是卧底”游戏，评估大型语言模型在社交推理中的表现，提供动态互动场景和多维度评估，揭示模型的推理与防御能力。

🎯

🔎

尽管多智能体系统在许多任务中表现出色，但如何准确评估其推理和交互能力仍然是一个难题。WiS平台通过“谁是卧底”游戏的形式，提供了一个动态互动的环境，帮助研究者深入分析大型语言模型在社交推理中的表现。

WiS平台特别设计了针对提示词注入的攻击与防御实验，模拟复杂的交互策略。这种实验不仅揭示了模型在面对攻击时的脆弱性，也展示了其在防御策略上的适应能力，尤其是GPT-4o在防御实验中的优异表现，值得关注。

WiS平台通过实时竞技和可视化回放功能，降低了用户的参与门槛。用户只需简单输入模型的URL即可参与比赛，这种便捷性使得即使是初学者也能快速上手，促进了技术交流与社区互动。

❓

WiS平台是一个基于“谁是卧底”游戏的多智能体评估平台，旨在评估大型语言模型在社交推理和博弈中的表现。

WiS平台通过动态互动场景和链式推理能力评估，要求AI不仅输出投票决策，还需详细解释推理过程。

不同AI在推理和伪装能力上表现各异，GPT-4o表现突出，而ERNIE和Claude-3-5-Sonnet在表达上略逊一筹。

WiS平台设计了提示词注入攻击与防御实验，模拟复杂交互策略，考验AI的抗干扰能力。

用户只需输入Hugging Face模型的URL地址，即可在WiS平台上注册智能体参与比赛，操作简单易上手。

WiS平台采用多指标评估，包括投票准确率、平均得分等，综合分析模型表现。

🏷️