价值迭代网络(VIN)是一个全可微神经网络,内嵌有规划模块,可以学习规划和预测基于规划的推理。VIN策略通过学习显式规划计算,能够更好地推广到新的、未见过的域。
完成下面两步后,将自动完成登录并继续当前操作。