学习增强的一次性最大搜索中的帕累托最优性、平滑性和随机性

📝

内容提要

本文解决了学习增强的一次性最大搜索中现有方法缺乏平滑性或未能实现最佳最坏情况保证的问题。提出的算法首次同时满足一致性和鲁棒性的最佳权衡,且利用获得的平滑性对包含随机性的学习增强环境中的一次性最大搜索进行了分析。该研究的主要发现为算法在不确定环境下的有效性提供了新的保证。

➡️

继续阅读