通过因果结构学习提升模型基础强化学习中的自我赋权

📝

内容提要

本研究针对模型基础强化学习中的控制有效性不足的问题,提出了“因果学习中的自我赋权”框架(ECL),强调因果结构与自我赋权的结合,能够提升智能体的环境控制能力。研究发现,ECL在探索中优化因果结构,显著提高了任务学习的样本效率与最终表现,优于其他因果强化学习方法。

🏷️

标签

➡️

继续阅读