OpenAI Five

OpenAI Five

💡 原文英文,约300词,阅读约需1分钟。
📝

内容提要

OpenAI Five团队的五个神经网络已开始击败业余人类团队,目标是在8月的国际赛事中挑战顶级职业队伍。它们每天进行180年游戏自我学习,使用256个GPU和128,000个CPU核心进行训练,8月5日将与顶级玩家比赛。

🎯

关键要点

  • OpenAI Five团队的五个神经网络开始击败业余人类团队。

  • 目标是在8月的国际赛事中挑战顶级职业队伍。

  • 目前的比赛受到英雄选择的限制。

  • Dota 2是全球最受欢迎和复杂的电子竞技游戏之一,年奖金池达到4000万美元。

  • OpenAI Five每天进行180年游戏的自我学习。

  • 训练使用256个GPU和128,000个CPU核心,采用Proximal Policy Optimization算法。

  • 每个英雄使用单独的LSTM进行学习,无需人类数据。

  • 强化学习可以实现长期规划,且规模可实现。

  • 将于8月5日与顶级玩家进行比赛,欢迎通过Twitch观看直播或申请现场观赛邀请。

延伸问答

OpenAI Five的目标是什么?

OpenAI Five的目标是在8月的国际赛事中挑战顶级职业队伍。

OpenAI Five是如何进行训练的?

OpenAI Five每天进行180年游戏的自我学习,使用256个GPU和128,000个CPU核心进行训练。

Dota 2的奖金池有多大?

Dota 2的年奖金池达到4000万美元,是全球最大的电子竞技游戏奖金池。

OpenAI Five使用了什么算法进行训练?

OpenAI Five采用了Proximal Policy Optimization算法进行训练。

OpenAI Five与人类团队的比赛有什么限制?

目前的比赛受到英雄选择的限制。

如何观看OpenAI Five与顶级玩家的比赛?

可以通过Twitch观看直播,或申请现场观赛邀请。

➡️

继续阅读