BriefGPT - AI 论文速递 ·

基于变分量子电路的强化学习的车载网络优化

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

本文提出了一种基于强化学习的框架，旨在优化自动驾驶车辆的网络选择和驾驶策略，以最小化碰撞和最大化通信数据速率。通过多目标马尔可夫决策过程，结合深度 Q 网络和变分量子电路，研究了车辆运动动态与通信效率之间的关系，验证了该方法在安全驾驶和连接性改善方面的有效性。

🎯

❓

通过将问题转化为多目标马尔可夫决策过程，结合深度 Q 网络，优化车辆的加速度、减速度和变道等行为，从而实现网络选择的优化。

变分量子电路用于减少模型参数，提高性能，并通过量子信息编码方案优化经典深度强化学习算法。

通过控制车辆的运动动态，最大化交通流量，最小化碰撞，并增强通信的可靠性和低延迟，从而提高安全性和通信效率。

该框架能够处理具有未知偏好的多目标策略，优化无线网络选择和自主驾驶策略，减少对标量奖励的依赖。

通过数值结果展示车辆运动动态、切换和通信数据速率之间的相关性，验证了安全驾驶行为和改善的连接性。

开发了一种新颖的信封 MORL 解决方案，能够为代理器处理具有未知偏好的多目标提出策略，优化多目标 Q 值的凸包。

🏷️