小红花·文摘

本研究将代理模型纳入多智能体情景下的部分可观察马尔可夫决策过程(POMDPs)，通过贝叶斯更新维护信念并求得最优方案。证明了POMDPs的重要特性在该框架下仍然成立。