本研究提出了一种新颖的分布感知投影梯度下降攻击(DAPGD),旨在解决深度强化学习中的观察信号不确定性问题。该方法通过利用分布相似性进行梯度扰动,综合整个策略分布。实验结果显示,DAPGD在机器人导航任务中的奖励下降效果比最佳基线提高了22.03%。
本文介绍了一种名为Violina的新方法,用于识别线性时间不变非马尔可夫动态模型。该方法通过投影梯度下降优化模型参数,使其预测与多个数据集匹配。实验表明,Violina在识别此类系统时优于现有方法。
该文介绍了一种数学严谨的方法,用于近似高维数据的类流形的微分几何,并实现了流形上的对抗训练的投影梯度下降算法,以解决神经网络对对抗性攻击的敏感性问题。该方法应用于神经网络图像分类器的设置中,在流形上生成新颖的数据样本。
完成下面两步后,将自动完成登录并继续当前操作。