The Berkeley Artificial Intelligence Research Blog ·

扩大强化学习在交通平滑中的应用：100辆自动驾驶汽车的高速公路部署

💡 原文英文，约2100词，阅读约需8分钟。

📝

内容提要

在高速公路上部署100辆强化学习控制的自动驾驶汽车，旨在缓解交通拥堵和降低燃油消耗。通过数据驱动的模拟，RL代理优化驾驶行为，减少“停走波”现象。实验表明，少量自动驾驶汽车显著改善交通流和燃油效率，且可在现代车辆上实施。

🎯

🔎

通过在高速公路上部署100辆强化学习控制的自动驾驶汽车，研究表明即使少量的自动驾驶汽车也能显著改善交通流动性和燃油效率。实验结果显示，周围车辆的燃油消耗减少了15%到20%。这表明，未来在交通管理中引入更多的自动驾驶技术可能会带来更广泛的环境效益。

设计有效的奖励函数以平衡波动平滑、能效、安全性和驾驶舒适性是强化学习应用中的一大挑战。研究者需要在不同目标之间找到合适的权重，以确保自动驾驶汽车在优化燃油效率的同时，保持安全和舒适的驾驶行为。这一过程的成功与否将直接影响未来自动驾驶技术的推广和应用。

此次实验采用去中心化的方式进行，100辆自动驾驶汽车之间没有显式的合作或通信。这种方式不仅降低了基础设施的需求，还使得在现有交通环境中更容易实施。随着技术的进步，未来可能会看到更多类似的去中心化交通管理方案，进一步提升交通效率。

❓

强化学习通过优化自动驾驶汽车的驾驶行为，减少交通中的“停走波”现象，从而显著改善交通流量和燃油效率。

“停走波”现象是由于驾驶行为的小波动在交通流中被放大，导致交通流动的突然减速和加速。

在实验中，自动驾驶汽车周围的燃油消耗减少了15%到20%。

强化学习代理的训练需要快速且真实的模拟，以复制高速公路上的停走行为。

自动驾驶汽车通过使用基本的传感器信息，如自身速度和前车速度，能够以去中心化的方式运行，无需额外基础设施。

未来需要提高模拟的速度和准确性，并考虑通过先进传感器或集中规划来改善控制器性能。

🏷️