通过自由能量最小化提升蒙特卡洛树搜索
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本研究提出了一种新规划框架,将蒙特卡洛树搜索与主动推理目标结合,以解决不确定环境中探索与目标导向行为的平衡问题。该方法在连续控制任务中优于独立的CEM和随机回合的MCTS。
🎯
关键要点
- 本研究提出了一种新规划框架,结合蒙特卡洛树搜索(MCTS)与主动推理目标。
- 该方法旨在解决不确定环境中探索与目标导向行为的平衡问题。
- 研究表明,此方法在连续控制任务中优于独立的CEM和随机回合的MCTS。
- 该框架能够在追求外在奖励的同时,系统性地减少认知不确定性。
➡️