小红花·文摘

本文介绍了多智能体 A*（MAA*）算法，旨在解决有限时间视野下的分散式部分可观测马尔可夫决策问题（DEC-POMDP）。该算法适用于多机器人协调和网络流量控制等合作代理的最优规划。同时，研究探讨了基于模拟的 POMDP 求解器和近似策略迭代算法在不完全信息环境中的应用，展示了现代启发式搜索方法的高效性。