小红花·文摘

本文提出了一种基于强化学习的框架，旨在优化自动驾驶车辆的网络选择和驾驶策略，以最小化碰撞和最大化通信数据速率。通过多目标马尔可夫决策过程，结合深度 Q 网络和变分量子电路，研究了车辆运动动态与通信效率之间的关系，验证了该方法在安全驾驶和连接性改善方面的有效性。

BriefGPT - AI 论文速递 ·

作者尝试通过邻居的CMCC宽带与自己的宽带进行负载均衡，但效果不佳。由于两条宽带的容量和速度不同，最终选择只通过邻居网络访问某些速度更快的目标。作者希望有一种自动机制来检测并选择最快的网络，这就是smartproxy的用途。

菜菜博士 ·