LLM-ABR是首个利用大型语言模型的自适应比特率算法,通过强化学习框架下的LLMs设计状态和神经网络架构等关键部件,能够适应不同网络特性。在多种网络设置下评估,包括宽带、卫星、4G和5G网络,LLM-ABR始终优于默认ABR算法。
该研究发现预训练的强化学习策略网络具有追求多个上下文相关目标的能力,并确定了对应电路。网络具有冗余、分布式和可重新设定目标表示的特性,阐明了训练策略网络中目标方向的本质。
完成下面两步后,将自动完成登录并继续当前操作。