小红花·文摘

本研究提出了一种新的基于规则的决策框架，解决了传统方法在动态场景中的抖动和死锁问题，特别是在代理群体对抗中。该框架结合了概率有限状态机、深度卷积网络和强化学习，显著提升了代理的合作与竞争策略，实验结果表明其性能优于其他方法。