本研究提出了一种新方法DNA-MARL,旨在解决多智能体协作强化学习中的部分可观测性问题。该方法通过局部通信和个体奖励来促进团队合作,适用于隐私受限和消息传递不完整的场景。
完成下面两步后,将自动完成登录并继续当前操作。