车载网络中的通信信道具有时变特性和双倍动态现象,对实时预编码器设计提出挑战。研究者提出使用约束深度强化学习(CDRL)来促进ISAC预编码器设计的动态更新,并采用PD-DDPG和Wolpertinger结构来训练算法以适应复杂约束和可变用户数量。实验证实了该方案的优越性。
CDRL是一种提高样本质量的方法,通过定义能量基模型并学习和采样来实现。在CIFAR-10和ImageNet 32x32上,CDRL方法比现有的EBM方法快2倍且有明显提高。此外,CDRL方法还可用于组合生成和图像修复任务,并实现了样本质量和样本多样性的权衡。
完成下面两步后,将自动完成登录并继续当前操作。