本研究提出了一种分布感知遗忘补偿(DAFC)模型,旨在解决长期行人重识别中的知识保留问题。该模型通过跨域共享表示学习和域特定分布整合,显著提升了知识保留能力,实验结果表明其性能优于现有技术。
本研究提出了一种新颖的分布感知投影梯度下降攻击(DAPGD),旨在解决深度强化学习中的观察信号不确定性问题。该方法通过利用分布相似性进行梯度扰动,综合整个策略分布。实验结果显示,DAPGD在机器人导航任务中的奖励下降效果比最佳基线提高了22.03%。
完成下面两步后,将自动完成登录并继续当前操作。