神ç»ç¬¦å·æ–¹æ³•åœ¨å¯è§£é‡Šæ€§å’Œæ¦‚率决ç–ä¸çš„多智能体强化å¦ä¹
原文约400字,阅读约需1分钟。发表于: 。多智能体强化学习(MARL)在优化多智能体共享资源中的系统性能方面具有潜力,但常见的深度学习 MARL 解决方案在真实世界问题中存在可解释性、样本效率、部分可观察性等问题。为了解决这些挑战,我们提出了一种基于事件驱动的公式,利用神经符号方法处理分布式协作 MARL 智能体的决策制定。我们还开发了一种新颖的概率神经符号框架,概率逻辑神经网络(PLNN),将逻辑推理能力与概率图模型相结合,以实现在不确定性和部分可观察性下的决策制定。我们通过解决片上系统中的功率共享问题来展示我们的研究成果。
多智能体强化学习(MARL)在优化多智能体共享资源中的系统性能方面具有潜力。研究者提出了一种基于事件驱动的公式和概率逻辑神经网络(PLNN)框架,用于处理分布式协作 MARL 智能体的决策制定。研究成果通过解决片上系统中的功率共享问题来展示。