本文介绍了多智能体 A*(MAA*)算法,旨在解决有限时间视野下的分散式部分可观测马尔可夫决策问题(DEC-POMDP)。该算法适用于多机器人协调和网络流量控制等合作代理的最优规划。同时,研究探讨了基于模拟的 POMDP 求解器和近似策略迭代算法在不完全信息环境中的应用,展示了现代启发式搜索方法的高效性。
完成下面两步后,将自动完成登录并继续当前操作。