基于 UCB 驱动的多目标增强学习的效用函数搜索
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
基于分解的多目标强化学习(MORL/D)引入了全面的分类体系,为现有和潜在MORL作品提供了结构化的基础。该框架展示了灵活性和多功能性,并为MORL领域的新研究方向奠定了基础,推动了该领域的发展。
🎯
关键要点
- 基于分解的多目标强化学习(MORL/D)引入了一个全面的分类体系。
- 该分类体系为现有和潜在的MORL作品提供了结构化的基础。
- 引入的框架展示了灵活性和多功能性。
- 该框架通过各种配置的实现证明了其多功能性。
- 本文为MORL提供了综合的视角和统一的词汇。
- 该分类体系有助于算法贡献的识别。
- 为MORL领域的新研究方向奠定了基础,推动了该领域的发展。
🏷️
标签
➡️