小红花·文摘

多智能体强化学习在共享资源优化中有潜力，但存在可解释性和样本效率问题。为此，提出事件驱动公式，结合神经符号方法进行决策。开发了概率逻辑神经网络（PLNN），融合逻辑推理与概率图模型，解决不确定性和部分可观察性问题，并在片上系统功率共享中验证。