BriefGPT - AI 论文速递 · 2024-04-19T00:00:00Z 单任务持续离线强化学习 📝 内容提要 本研究提出了一种新的算法,名为基于经验回放的集成离线强化学习,通过引入多个值网络来学习相同的数据集,并通过值网络的离散程度判断策略是否已经学习,以提高单任务离线强化学习网络的性能。 阅读原文 生成长图 分享链接 已复制链接