小红花·文摘

本研究提出了一种新颖的分布感知投影梯度下降攻击（DAPGD），旨在解决深度强化学习中的观察信号不确定性问题。该方法通过利用分布相似性进行梯度扰动，综合整个策略分布。实验结果显示，DAPGD在机器人导航任务中的奖励下降效果比最佳基线提高了22.03%。

BriefGPT - AI 论文速递 ·

本文介绍了一种名为Violina的新方法，用于识别线性时间不变非马尔可夫动态模型。该方法通过投影梯度下降优化模型参数，使其预测与多个数据集匹配。实验表明，Violina在识别此类系统时优于现有方法。

BriefGPT - AI 论文速递 ·

该文介绍了一种数学严谨的方法，用于近似高维数据的类流形的微分几何，并实现了流形上的对抗训练的投影梯度下降算法，以解决神经网络对对抗性攻击的敏感性问题。该方法应用于神经网络图像分类器的设置中，在流形上生成新颖的数据样本。

BriefGPT - AI 论文速递 ·