基于生成流网络的多智能体连续控制

本研究针对生成流网络在多智能体系统中的应用限制，提出了一种新的多智能体生成连续流网络（MACFN）方法，解决了连续联合控制问题。MACFN通过引入连续流分解网络，实现了在集中训练下的去中心化个体流策略，使得各个智能体能够根据各自的局部流进行协作探索，从而在奖励上形成比例分布。实验结果表明，该方法优于目前的最佳技术，具有更好的探索能力。

生成流网络（GFlowNets）是一种通过操作离散对象的组合采样方法，与强化学习相结合。研究者将学习生成流网络的任务重新定义为熵正则化强化学习问题，并展示了其在概率建模任务上的实际效率。熵正则化强化学习方法可以与已建立的GFlowNet训练方法竞争，为整合强化学习原理到生成流网络领域开辟了道路。

多智能体强化学习概率建模熵正则化生成流网络离散对象