小红花·文摘

本文综述了多智能体强化学习（MARL）的理论分析，重点讨论了马尔可夫博弈和扩展形式博弈中的算法结果，提出了新的马尔可夫潜势博弈定义和独立策略梯度算法，并验证了其收敛性和有效性。同时，探讨了公平性和风险厌恶等人类决策因素在MARL中的应用。