小红花·文摘

本研究比较了多智能体强化学习（MARL）与传统固定时间信号控制在交通信号优化中的效果。结果表明，MARL显著降低了平均等待时间，提高了通行能力，显示其在城市交通管理中的重要潜力。

A Comparative Study of Multi-Agent Reinforcement Learning and Fixed-Time Control for Traffic Signal Optimization: A Simulation Study

BriefGPT - AI 论文速递 ·

本文探讨了多智能体强化学习（MARL）在资源分配优化（RAO）中的应用，提出了结构化分类法，并指出了当前研究面临的挑战与未来发展方向，旨在帮助研究者更有效地利用MARL改善资源分配。研究表明，MARL在动态和分散决策中显著促进了RAO。

A Review of the Application of Multi-Agent Reinforcement Learning in Resource Allocation Optimization

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的部分等变图神经网络（PEnGUiN）架构，旨在提高多智能体强化学习的样本效率。实验结果表明，PEnGUiN在不对称环境中优于传统图神经网络，显示出良好的应用潜力。

部分等变图神经网络（PEnGUiN）：提升样本效率的多智能体强化学习

BriefGPT - AI 论文速递 ·

本研究提出三种适用于合作、对抗和混合环境的演员-评论家算法，解决多智能体强化学习中去中心化训练的不足。通过引入网络通信和替代策略，去中心化算法在降低计算成本的同时，能与原始MADDPG算法达到相似效果，尤其在代理数量较多时更为明显。

完全去中心化的MADDPG与网络化代理

BriefGPT - AI 论文速递 ·

本研究提出了一种基于视觉心智理论的推理沟通模型，解决了动物界缺乏符号写作系统的问题。通过多智能体强化学习，揭示了早期写作系统发展的认知与文化过程，对理解人类与动物的沟通机制具有重要意义。

The Invention of Writing Systems Facilitated by Visual Mind Theory

BriefGPT - AI 论文速递 ·

本研究提出了一种基于可解释人工智能的框架，旨在解决6G网络中深度学习模型的可解释性问题。通过特征选择和模型简化，优化多智能体深度强化学习的决策过程，实验结果显示性能损失仅为3%，同时显著减少了特征数量和训练时间。

Explainable AI-Aided Feature Selection and Model Reduction for Deep Reinforcement Learning-Based V2X Resource Allocation

BriefGPT - AI 论文速递 ·

本研究提出了一种基于多智能体强化学习的方法，优化粒子探测器中的粒子轨迹重构问题。通过任务分配约束，显著提升了重构性能并降低了预测不稳定性。

Constrained Optimization of Charged Particle Tracking Based on Multi-Agent Reinforcement Learning

BriefGPT - AI 论文速递 ·

本研究提出了SMAC-HARD基准，旨在解决多智能体强化学习中对手策略多样性不足的问题。通过支持可定制的对手策略和无监督自我对弈，增强了训练的鲁棒性，促进了多智能体强化学习算法的发展。

SMAC-Hard: Enabling Mixed Opponent Strategy Scripts and Self-Play in SMAC

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法LeaDQ，旨在解决联邦学习中未标记数据流的样本选择问题。通过多智能体强化学习优化客户端策略，显著提高了全球模型的准确性，实验结果表明其优于现有基准算法。

如何从未标记的数据流中查询联邦学习

BriefGPT - AI 论文速递 ·

本研究探讨了多智能体强化学习（MARL）在不相关并行机器调度中的应用，并比较了MARL与单智能体算法的表现。结果表明，多智能体PPO算法在可扩展性方面表现良好，但在协作学习上面临挑战，为调度优化提供了新视角。

Exploring the Application of Multi-Agent Reinforcement Learning in Unrelated Parallel Machine Scheduling

BriefGPT - AI 论文速递 ·

本文探讨了一种对抗性强化学习算法，以增强自主车辆对网络物理攻击的鲁棒性。研究分析了攻击者与车辆的互动，提出了基于强化学习的自动化网络防御代理，并评估其在不同攻击策略下的表现。通过深度学习技术，展示了多智能体强化学习在网络防御中的潜力，并提出了未来研究方向。

探索强化学习在自主军事车辆事件响应中的应用

BriefGPT - AI 论文速递 ·

本文综述了多智能体强化学习（MARL）的理论分析，重点讨论了马尔可夫博弈和扩展形式博弈中的算法结果，提出了新的马尔可夫潜势博弈定义和独立策略梯度算法，并验证了其收敛性和有效性。同时，探讨了公平性和风险厌恶等人类决策因素在MARL中的应用。

凸马尔可夫博弈：多智能体学习中的公平性、模仿和创造性框架

BriefGPT - AI 论文速递 ·

本文介绍了多智能体强化学习（MARL）的新方法，如REFIL、CTRL和MABE，旨在提高学习效率和泛化能力。这些方法在复杂环境下的应用表现优异，尤其在自动驾驶和战斗仿真中显著提升了训练效率和适应性。

闪烁融合：轨迹内领域泛化的多智能体强化学习

BriefGPT - AI 论文速递 ·

本文探讨了自动驾驶车辆如何利用基于层次逆强化学习的概率预测方法，准确预测周围车辆行为并进行规划。提出的奖励增强模仿学习（RAIL）方法在复杂场景中提升了智能体的表现，并展示了深度强化学习和风险感知奖励塑形在自动驾驶中的应用，强调了多智能体强化学习在资源分配和环境建模中的重要性。

城市自动驾驶的强化模仿轨迹规划

BriefGPT - AI 论文速递 ·

该研究提出了一种神经符号强化学习架构，克服了深度学习的局限性。通过简单游戏实验，验证了该架构的有效性，能够学习符号规则并提升性能。同时，研究探讨了基于逻辑神经网络的快速收敛方法和多智能体强化学习的决策制定，强调可解释性和效率。

BlendRL：合并符号与神经策略学习的框架

BriefGPT - AI 论文速递 ·

本文介绍了一种新的神经网络架构——路由网络，通过协同多智能体强化学习动态组合功能块，提升多任务学习的准确性和收敛速度。同时，提出了梯度对抗性训练框架和“路径修补”技术，分析神经网络的行为和故障模式，并探讨了稀疏网络的优化方法和梯度网络，为深度学习提供新的设计思路和实践指导。

梯度路由：掩蔽梯度以局部化神经网络中的计算

BriefGPT - AI 论文速递 ·

本文介绍了多智能体强化学习的最新研究进展，包括分层生成模型、条件生成模型和多模态基础世界模型等新方法。这些方法在复杂环境中表现出色，提升了样本效率和决策能力，推动了生成人工智能的应用与发展。

通过生成世界模型解决多智能体决策问题的基础答案

BriefGPT - AI 论文速递 ·

本文研究多智能体强化学习在仿真与现实差距中的脆弱性，提出稳健马克夫博弈（RMG）来解决多智能体诅咒。开发了样本高效算法，提升了在状态不确定性下的鲁棒性，并在多模态环境中实现了先进水平。研究还优化了样本复杂度，确保策略在环境不确定性下的鲁棒性。

我们能打破多智能体稳健强化学习的多机构诅咒吗？

BriefGPT - AI 论文速递 ·

本研究提出了一种去中心化策略网络，利用多智能体强化学习实现多无人机系统在动态场景中的时间最优运动规划。通过灵活的碰撞惩罚机制，平衡飞行效率与碰撞避免。实验结果显示，该方法在接近时间最优的同时，保持低碰撞率，并在实际应用中表现良好。

追逐金色飞体：多无人机时间最优运动规划与多智能体增强学习

BriefGPT - AI 论文速递 ·

本文综述了多智能体强化学习（MARL）的理论分析，重点讨论离线MARL的基准和评估方法，提出了OG-MARL数据集及算法框架，并强调数据共享和分布偏移问题。研究表明，简单的基准方法在多个任务中优于复杂算法，为未来研究提供了参考。

将数据置于离线多智能体强化学习的中心

BriefGPT - AI 论文速递 ·