多智能体强化学习在共享资源优化中有潜力,但存在可解释性和样本效率问题。为此,提出事件驱动公式,结合神经符号方法进行决策。开发了概率逻辑神经网络(PLNN),融合逻辑推理与概率图模型,解决不确定性和部分可观察性问题,并在片上系统功率共享中验证。
完成下面两步后,将自动完成登录并继续当前操作。