小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究比较了多智能体强化学习(MARL)与传统固定时间信号控制在交通信号优化中的效果。结果表明,MARL显著降低了平均等待时间,提高了通行能力,显示其在城市交通管理中的重要潜力。

A Comparative Study of Multi-Agent Reinforcement Learning and Fixed-Time Control for Traffic Signal Optimization: A Simulation Study

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本文探讨了多智能体强化学习(MARL)在资源分配优化(RAO)中的应用,提出了结构化分类法,并指出了当前研究面临的挑战与未来发展方向,旨在帮助研究者更有效地利用MARL改善资源分配。研究表明,MARL在动态和分散决策中显著促进了RAO。

A Review of the Application of Multi-Agent Reinforcement Learning in Resource Allocation Optimization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z

本研究提出了一种新颖的部分等变图神经网络(PEnGUiN)架构,旨在提高多智能体强化学习的样本效率。实验结果表明,PEnGUiN在不对称环境中优于传统图神经网络,显示出良好的应用潜力。

部分等变图神经网络(PEnGUiN):提升样本效率的多智能体强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z

本研究提出三种适用于合作、对抗和混合环境的演员-评论家算法,解决多智能体强化学习中去中心化训练的不足。通过引入网络通信和替代策略,去中心化算法在降低计算成本的同时,能与原始MADDPG算法达到相似效果,尤其在代理数量较多时更为明显。

完全去中心化的MADDPG与网络化代理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-09T00:00:00Z

本研究提出了一种基于视觉心智理论的推理沟通模型,解决了动物界缺乏符号写作系统的问题。通过多智能体强化学习,揭示了早期写作系统发展的认知与文化过程,对理解人类与动物的沟通机制具有重要意义。

视觉心智理论促成写作系统的发明

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-03T00:00:00Z

本研究探讨了无人机在动态环境中协作执行任务的挑战,重点分析了电池容量对网络性能的影响。通过多智能体强化学习(MARL),智能体能够有效协作和规划轨迹,实验成功率达到80%至100%。

能源感知的多智能体强化学习在任务导向无人机网络中的协作执行

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

多智能体强化学习在共享资源优化中有潜力,但存在可解释性和样本效率问题。为此,提出事件驱动公式,结合神经符号方法进行决策。开发了概率逻辑神经网络(PLNN),融合逻辑推理与概率图模型,解决不确定性和部分可观察性问题,并在片上系统功率共享中验证。

BlendRL:合并符号与神经策略学习的框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-15T00:00:00Z

本文研究多智能体强化学习在仿真与现实差距中的脆弱性,提出稳健马克夫博弈(RMG)来解决多智能体诅咒。开发了样本高效算法,提升了在状态不确定性下的鲁棒性,并在多模态环境中实现了先进水平。研究还优化了样本复杂度,确保策略在环境不确定性下的鲁棒性。

我们能打破多智能体稳健强化学习的多机构诅咒吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

本研究提出了一种去中心化策略网络,利用多智能体强化学习实现多无人机系统在动态场景中的时间最优运动规划。通过灵活的碰撞惩罚机制,平衡飞行效率与碰撞避免。实验结果显示,该方法在接近时间最优的同时,保持低碰撞率,并在实际应用中表现良好。

追逐金色飞体:多无人机时间最优运动规划与多智能体增强学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

该文章介绍了一种解决多智能体强化学习通信问题的方法,通过自我监督的方式使用自动编码器预训练通信策略,实现从智能体观察中学习潜在马尔可夫状态。该方法适应新任务,支持智能体扩展,并能检测异常事件。实证结果显示该方法在未知任务中优于特定任务的通信策略。

需求感知的定制化多智能体通信协议与上界训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-11T00:00:00Z

本研究回顾了181篇相关科学出版物,探讨了人工智能领域中新兴语言的定义、评估方法和研究不足。研究发现多智能体强化学习可解决学习沟通问题,探讨了多智能体通讯游戏中的紧急语言现象,重构了语言游戏范式,并研究了深度学习时代的紧急多智能体交流。提出了一个新的神经智能代理语言学习和通讯框架,成功实现了无偏见的代理之间单词顺序/格标记权衡的复制。研究还探讨了语言模型中的紧迫沟通与学习压力,以及基于深度学习的紧急通信应用。最后,研究解决了新兴语言在复杂多智能体系统中的通信现象不足的问题。

新兴语言研究综述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z

本研究提出了解决多智能体强化学习中对称性假设限制问题的方法,将不对称博弈扩展为诱导MFG。研究发现,诱导的MFG纳什策略可作为N玩家动态博弈的近似纳什策略,为多智能体系统的学习提供了新的理论支持和实践潜力。

利用近似对称性实现高效的多智能体强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

本研究旨在解决自动驾驶中多智能体强化学习的复杂性和资源分配问题。研究提出了模拟器指标,并总结了现有基准的特点,回顾了相关基础知识和近期进展,为智能和自主驾驶领域的MARL技术整合提供了新思路和机会。

多智能体强化学习在自动驾驶中的应用:综述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z

本文研究了多智能体强化学习中策略梯度方法的全局非渐进收敛性质,提出了新的独立策略梯度算法,并证明了其达到epsilon-Nash平衡的迭代复杂度为O(1/epsilon^2),同时建立了样本复杂度为O(1/epsilon^5)的界限。还找到了一类独立策略梯度算法,可在玩家对游戏类型无感知的情况下,实现零和马尔科夫博弈和合作马尔科夫博弈的收敛性。实验证明了理论成果的优点和有效性。

马尔可夫潜在博弈的独立策略镜像下降:扩展到大数量玩家

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-15T00:00:00Z

本文提出了一种新的多智能体强化学习方法,通过合作任务分解和学习奖励机器的结合来处理部分可观察环境中奖励的非马尔可夫性质,并提高了学习策略的可解释性。该方法在具有大状态空间和多个智能体的复杂环境中具有潜力。

最大宽容奖励机器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-15T00:00:00Z

本研究通过信息密集型观察的方法解决了多智能体强化学习在运动规划中的问题,实现了零次学习,缩短了训练时间,提升了智能体的适应能力。对自动驾驶车辆具有重要影响。

SigmaRL:一种样本效率高且具有普适性的多智能体强化学习框架用于运动规划

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-14T00:00:00Z

ARCO是一个基于多智能体强化学习的自适应协同编译框架,提高了机器学习模型在不同硬件平台上的效率。通过整合硬件和软件优化智能体,ARCO框架提高了深度神经网络部署的精度和速度。在各种DNNs中,ARCO框架实现了最高37.95%的吞吐量增加,并将优化时间降低了最高42.2%。

MARCO: 内存增强的组合优化增强学习框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-05T00:00:00Z

该研究提出了一种基于分层一致性的多智能体强化学习框架,通过对比学习促进智能体之间的全局一致性,实现协同行为而无需直接通信。该框架允许智能体从地方观测中形成全局一致性,并通过自适应注意机制调整每个一致性层的影响,以适应特定任务的要求。实验结果表明,该框架在多机器人系统中取得了显著的进展。

基于层次一致性的多智能体强化学习在多机器人协作任务中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-11T00:00:00Z

本文介绍了一种新的框架,使得多智能体强化学习能够进行迁移学习。通过从其他场景学习到的机动技能,相比于从头学习的智能体,我们的方法在多智能体学习性能方面取得了显著的提升。

基于多智能体强化学习的多方案组合优化广告推荐系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-03T00:00:00Z

研究人员将扩散模型与多智能体强化学习相结合,提出了一个创新的框架来解决在线学习在实际环境中的风险。他们的方法基于分散执行架构中的集中式训练,并采用专门的算法确保操作安全性。实验结果表明,该方法在符合严格的安全约束的同时,在性能上优于现有方法。

离线多智能体强化学习与安全约束的扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-30T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码