层次化通用价值函数近似器

📝

内容提要

本研究解决了多目标强化学习价值函数的通用近似器构建中存在的关键问题,提出了层次化通用价值函数近似器(H-UVFAs),利用选项框架进行扩展。研究发现,H-UVFAs在时间抽象设置中展现出更好的规划和泛化能力,且在性能上超过了相应的通用价值函数近似器(UVFAs)。

🏷️

标签

➡️

继续阅读