小红花·文摘

本文提出了一种基于多智能体强化学习的框架，通过优化关键绩效指标（KPI）和协调多个意图，实现更快、更好地满足期望行为。实验结果表明，该方法在意图实现和KPI优化方面优于传统规则方法。