本研究提出了一种基于去中心化部分可观测马尔可夫决策过程的多智能体强化学习模型,旨在优化城市巡逻路线,提高犯罪高发区域的监控覆盖率。研究表明,该模型在马拉加市实现了90%以上的高犯罪率节点覆盖,显著提升了警务资源分配效率。
完成下面两步后,将自动完成登录并继续当前操作。