💡
原文英文,约300词,阅读约需1分钟。
📝
内容提要
OpenAI Five团队的五个神经网络已开始击败业余人类团队,目标是在8月的国际赛事中挑战顶级职业队伍。它们每天进行180年游戏自我学习,使用256个GPU和128,000个CPU核心进行训练,8月5日将与顶级玩家比赛。
🎯
关键要点
-
OpenAI Five团队的五个神经网络开始击败业余人类团队。
-
目标是在8月的国际赛事中挑战顶级职业队伍。
-
目前的比赛受到英雄选择的限制。
-
Dota 2是全球最受欢迎和复杂的电子竞技游戏之一,年奖金池达到4000万美元。
-
OpenAI Five每天进行180年游戏的自我学习。
-
训练使用256个GPU和128,000个CPU核心,采用Proximal Policy Optimization算法。
-
每个英雄使用单独的LSTM进行学习,无需人类数据。
-
强化学习可以实现长期规划,且规模可实现。
-
将于8月5日与顶级玩家进行比赛,欢迎通过Twitch观看直播或申请现场观赛邀请。
❓
延伸问答
OpenAI Five的目标是什么?
OpenAI Five的目标是在8月的国际赛事中挑战顶级职业队伍。
OpenAI Five是如何进行训练的?
OpenAI Five每天进行180年游戏的自我学习,使用256个GPU和128,000个CPU核心进行训练。
Dota 2的奖金池有多大?
Dota 2的年奖金池达到4000万美元,是全球最大的电子竞技游戏奖金池。
OpenAI Five使用了什么算法进行训练?
OpenAI Five采用了Proximal Policy Optimization算法进行训练。
OpenAI Five与人类团队的比赛有什么限制?
目前的比赛受到英雄选择的限制。
如何观看OpenAI Five与顶级玩家的比赛?
可以通过Twitch观看直播,或申请现场观赛邀请。
➡️