线性情境马尔可夫决策过程的样本复杂度刻画

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该论文研究了在线性函数逼近模型下上下文马尔可夫决策过程(CMDPs)的性质和算法,并证明了其在样本复杂度方面的优越性。比较结果显示,上下文变化的特征在线性CMDPs中具有更好的样本效率。

🎯

关键要点

  • 该论文研究了上下文马尔可夫决策过程(CMDPs)在线性函数逼近模型下的性质。

  • 提出了创新的基于模型的算法。

  • 证明了CMDPs在样本复杂度方面的优越性。

  • 比较结果显示,上下文变化的特征在样本效率上优于所有上下文共享表示。

➡️

继续阅读