本研究评估了GovSim框架,探讨大语言模型(LLMs)在资源共享中的合作决策能力。结果表明,GPT-4-turbo等大型模型在有无普遍化原则下均能实现可持续合作,而小模型则无法做到。这为大型模型在复杂合作任务中的适应性提供了重要见解。
本研究分析了多智能体合作决策的关键问题,系统梳理了主要决策方法,重点探讨了深度强化学习和大型语言模型的新技术,发现其在效率和灵活性方面具有显著优势。
本文研究了分散式多臂赌博机问题,提出了优化秩序和公平性的政策,应用于认知无线电和通信系统等领域。通过多种算法解决智能体间的合作决策,优化遗憾度和通信复杂度,验证了算法的有效性和鲁棒性。
本研究提出了一种基于模块化状态的斯塔克尔博格游戏(Mod-SbSG),旨在提高分布式制造系统中自学习代理的合作决策效率。该方法优化了决策过程,显著降低了能耗和溢出,改善了系统的整体目标值。
完成下面两步后,将自动完成登录并继续当前操作。