本文介绍了一种名为MAVEN的新方法,通过结合价值和基于策略的方法,引入层次控制的潜在空间来解决QMIX和类似方法中的探索不足和次优现象。MAVEN在SMAC动态负载均衡问题上取得了显著性能提升,是解决复杂多智能体任务的重要方法。
完成下面两步后,将自动完成登录并继续当前操作。