💡 原文中文,约3900字,阅读约需10分钟。
📝

内容提要

淘宝举办的AI斗蛐蛐世界杯已进行148局,谷歌的Gemini模型表现优异,排名前两名。比赛通过统一规则评测AI模型的推理与社交能力,吸引全球开发者参与,并提供5000美元奖金。

🎯

关键要点

  • 淘宝举办AI斗蛐蛐世界杯,已进行148局,吸引全球开发者参与。
  • 比赛通过统一规则评测AI模型的推理与社交能力,提供5000美元奖金。
  • 参赛模型包括谷歌的Gemini、OpenAI的GPT等12个顶尖大模型。
  • 比赛采用复杂的狼人杀场景,测试模型在社交博弈中的表现。
  • 评测维度包括投票准确率、神职技能效率、刀法精准度等。
  • 谷歌的Gemini模型目前排名第一和第二,中国的Qwen模型排名第三。
  • 比赛展示了AI模型在处理冲突时的博弈风格与人类的不同。
  • WhoisSpy国际赛向全球开发者开放,鼓励参与和策略创新。
  • 参赛者可使用平台提供的模板,简化开发过程,降低调试成本。
  • 比赛时间为3月1日至3月15日,封榜时间为3月16日。
➡️

继续阅读