小红花·文摘 - 小红花技术领袖俱乐部

本文提出了一种简化的车辆微观模拟方法，并使用深度强化学习优化了六个交通系统的控制策略。研究发现了多种新行为，并分析了这些行为以获得可解释的控制策略。

让混合 A * 路径规划器遵守交通规则：基于深度强化学习的规划框架

BriefGPT - AI 论文速递 ·

通过实验和分析，研究发现迭代人在寻找新行为方面更有效。实验中发现了23个新的紧急行为，其中18个是新发现。这是首个已知的计算无关代理异构群体的紧急行为。

进化异质群体中专业集体行为的形成

BriefGPT - AI 论文速递 ·