神经符号方法在可解释性和概率决策中的多智能体强化学ä¹

原文约400字,阅读约需1分钟。发表于:

多智能体强化学习(MARL)在优化多智能体共享资源中的系统性能方面具有潜力,但常见的深度学习 MARL 解决方案在真实世界问题中存在可解释性、样本效率、部分可观察性等问题。为了解决这些挑战,我们提出了一种基于事件驱动的公式,利用神经符号方法处理分布式协作 MARL 智能体的决策制定。我们还开发了一种新颖的概率神经符号框架,概率逻辑神经网络(PLNN),将逻辑推理能力与概率图模型相结合,以实现在不确定性和部分可观察性下的决策制定。我们通过解决片上系统中的功率共享问题来展示我们的研究成果。

多智能体强化学习(MARL)在优化多智能体共享资源中的系统性能方面具有潜力。研究者提出了一种基于事件驱动的公式和概率逻辑神经网络(PLNN)框架,用于处理分布式协作 MARL 智能体的决策制定。研究成果通过解决片上系统中的功率共享问题来展示。

相关推荐 去reddit讨论