小红花·文摘

本文提出了一种基于两阶段博弈模型的自动化机制设计框架，应用于不完全信息博弈，利用黑盒优化算法进行机制设计优化。研究了多智能体强化学习中的奖励机制、样本效率和均衡计算，提出新方法优化学习策略，并通过实证研究验证其有效性。