记忆增强型神经求解器在组合优化中的高效自适应
原文中文,约200字,阅读约需1分钟。发表于: 。MEMENTO 是一种基于记忆的强化学习方法,可以在推理时间动态更新行动分布,提高神经求解器的适应性和性能。
我们提出了一种基于深度 Q 网络算法的记忆效率强化学习算法,通过合并知识减少遗忘并保持高的样本效率。在特征和图像任务中取得了相当或更好的性能,同时减轻了经验重放缓冲区的负担。
MEMENTO 是一种基于记忆的强化学习方法,可以在推理时间动态更新行动分布,提高神经求解器的适应性和性能。
我们提出了一种基于深度 Q 网络算法的记忆效率强化学习算法,通过合并知识减少遗忘并保持高的样本效率。在特征和图像任务中取得了相当或更好的性能,同时减轻了经验重放缓冲区的负担。