基于马尔可夫决策过程、实体嵌入和代理集成的上下文感知型代理策略组合

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种基于仿真的新方法,通过知识图和实体嵌入来表示异构上下文,并使用并行运行的代理集合对需求进行上下文感知型策略的组合。评估结果表明,代理可以即时请求组合策略,以成功完成适应上下文的活动,而无需通过冗长的训练步骤和场景学习这些策略。与应用强化学习的代理不同。

🎯

关键要点

  • 提出了一种基于仿真的新方法。
  • 通过知识图和实体嵌入来表示异构上下文。
  • 使用并行运行的代理集合对需求进行上下文感知型策略的组合。
  • 在 'Virtual Home' 数据集上的评估表明代理可以即时请求组合策略。
  • 代理能够成功完成适应上下文的活动,无需冗长的训练步骤。
  • 与应用强化学习的代理不同。
➡️

继续阅读