扩散增强代理:高效探索和迁移学习框架
原文中文,约500字,阅读约需1分钟。发表于: 。Diffusion Augmented Agents (DAAG) 利用大型语言模型、视觉语言模型和扩散模型,提供了一种新的框架来改善具体体验代理的样本效率和迁移学习。DAAG...
Diffusion Augmented Agents (DAAG)是一个新的框架,可以提高具体经验代理的样本效率和迁移学习。DAAG使用回顾法重新标记代理的过去经验,使用扩散模型将其与目标指令对齐,并使用大型语言模型组织这个自主过程,无需人类监督,适应终身学习场景。该框架减少了训练视觉语言模型和强化学习代理在新任务上所需的标记奖励数据量。DAAG在涉及操作和导航的模拟机器人环境中展示了改进的样本效率。结果表明,DAAG增强了奖励检测器的学习、过去经验的迁移以及新任务的获取,这对于开发高效的终身学习代理非常重要。他们的网站上还提供了额外的材料和视觉内容。