小红花·文摘

本研究探讨了多智能体Q学习在随机网络中的动态行为，特别关注代理数量增加时的收敛问题。通过分析探索率、收益矩阵和网络稀疏性，提出了新的条件，表明在控制网络稀疏性时，多智能体系统能够实现可靠的收敛。