我们训练了一个神经网络,通过视频预训练(VPT)在大量未标记的Minecraft游戏视频数据集上学习,并使用少量标记数据进行微调。该模型能够学习制作钻石工具,通常需要熟练人类超过20分钟。它使用人类的键盘和鼠标操作接口,代表了通用计算机代理的进步。
完成下面两步后,将自动完成登录并继续当前操作。