更新的蒙特卡洛树搜索（UMCTS）算法用于桁架结构尺寸优化问题的启发式全局搜索

通过结合更新蒙特卡洛树搜索法和强化学习技术，本文提出了一种名为更新蒙特卡洛树搜索的高效优化算法，用于寻找适宜的桁架结构设计，数值结果表明该方法比传统方法计算时间至少快十倍且能稳定获得更好的解。

本文介绍了一种基于模型的强化学习技术，将 Monte-Carlo 树搜索应用于无限期 Marov 决策过程的有限期版本，并使用值函数和策略函数的组合来规定有限期问题的终端条件或决策树的叶节点评估器。作者提供了第一个基于树搜索的强化学习算法的样本复杂度边界，并证明由深度神经网络实现的技术能够创建一种竞争性人工智能代理。