作者提出了Differentiable Tree Search (DTS)神经网络架构,通过嵌入最佳优先在线搜索算法,解决了模型精度不准确导致的性能问题。DTS通过可微的在线搜索和优化世界模型,减轻模型不准确性的影响。实验结果表明,DTS优于无模型和有模型的基准算法。
完成下面两步后,将自动完成登录并继续当前操作。