小红花·文摘

本研究提出了一种新方法DNA-MARL，旨在解决多智能体协作强化学习中的部分可观测性问题。该方法通过局部通信和个体奖励来促进团队合作，适用于隐私受限和消息传递不完整的场景。