我们训练了两个神经网络,使其能够用类人机器人手解决魔方。该系统在模拟环境中完全训练,使用与OpenAI Five相同的强化学习代码,并结合自动领域随机化(ADR)技术。它能够处理训练中未见过的情况,表明强化学习可以解决现实世界中需要高灵巧度的问题。
完成下面两步后,将自动完成登录并继续当前操作。