基于马尔可夫决策过程、实体嵌入和代理集成的上下文感知型代理策略组合
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种基于仿真的新方法,通过知识图和实体嵌入来表示异构上下文,并使用并行运行的代理集合对需求进行上下文感知型策略的组合。评估结果表明,代理可以即时请求组合策略,以成功完成适应上下文的活动,而无需通过冗长的训练步骤和场景学习这些策略。与应用强化学习的代理不同。
🎯
关键要点
- 提出了一种基于仿真的新方法。
- 通过知识图和实体嵌入来表示异构上下文。
- 使用并行运行的代理集合对需求进行上下文感知型策略的组合。
- 在 'Virtual Home' 数据集上的评估表明代理可以即时请求组合策略。
- 代理能够成功完成适应上下文的活动,无需冗长的训练步骤。
- 与应用强化学习的代理不同。
➡️