CAESAR: 通过收敛感知采样和筛选增强异构 MDP 中的联邦强化学习

📝

内容提要

研究了异构环境下联邦强化学习中的收敛感知采样与筛选聚合方案(CAESAR),通过将同一马尔可夫决策过程中学习的代理的知识有选择地吸收到更优的对应代理中,显著提高学习效率

🏷️

标签

➡️

继续阅读