使用多智能体 A* 近似求解 Dec-POMDP
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了一种基于A*算法的有限时域Dec-POMDPs策略计算方法。该方法以可扩展性为代价来牺牲最优性,在较大的时域内取得竞争性性能。主要特点包括使用聚类的滑动窗口内存、修剪A*搜索树以及使用新颖的A*启发式策略。实验结果显示该方法与最先进的方法相比具有竞争力,并在多个基准测试中表现更优异。此外,还提供了一种基于A*算法的找到最优值上界的方法,适用于长时域问题。实验证明了该方法的有效性和可扩展性。
🎯
关键要点
- 提出了一种基于A*算法的有限时域Dec-POMDPs策略计算方法。
- 该方法以可扩展性为代价牺牲最优性,在较大的时域内取得竞争性性能。
- 主要特点包括使用聚类的滑动窗口内存、修剪A*搜索树和新颖的A*启发式策略。
- 实验结果显示该方法与最先进的方法相比具有竞争力,并在多个基准测试中表现更优异。
- 提供了一种基于A*算法的找到最优值上界的方法,适用于长时域问题。
- 新启发式方法定期揭示状态,从而限制可达置信度的数量。
- 实验证明了该方法的有效性和可扩展性。
🏷️
标签
➡️