离线强化学习在视觉和语言导航中的扩展
通过使用次优示范数据进行视觉语言导航 (VLN) 的离线强化学习 (ORL) 研究,引入了一种简单且有效的奖励条件方法来训练 VLN 代理,并在该领域推动研究进展和评估。实验证明,即使在复杂和复杂的环境中,所提出的奖励条件方法也能显著提高性能。
本文提出了一个新型导航框架,用于解决真实世界中的VLN任务。该框架包括语言指令解析器、视觉-语言映射器、定位器和本地控制器等关键组成部分。实验室环境评估显示,该框架在真实世界中表现优于现有的VLN基线。
BriefGPT - AI 论文速递 -
通过使用次优示范数据进行视觉语言导航 (VLN) 的离线强化学习 (ORL) 研究,引入了一种简单且有效的奖励条件方法来训练 VLN 代理,并在该领域推动研究进展和评估。实验证明,即使在复杂和复杂的环境中,所提出的奖励条件方法也能显著提高性能。
本文提出了一个新型导航框架,用于解决真实世界中的VLN任务。该框架包括语言指令解析器、视觉-语言映射器、定位器和本地控制器等关键组成部分。实验室环境评估显示,该框架在真实世界中表现优于现有的VLN基线。
热榜 Top10
标签 Top100
全部ai 语言模型 神经网络 linux llm 开源 微软 .net python 人工智能 数据集 google 算法 apple 扩散模型 安全 机器学习 苹果 java 深度学习 android rust 游戏 postgresql 建模 机器人 ios 漏洞 谷歌 windows mysql openai c# spring 大模型 api 函数 开发者 gpt 教程 github chatgpt microsoft windows 11 卷积 数据库 nvidia web mongodb iphone 内存 强化学习 浏览器 插件 security cloud docker sql 编码器 大语言模型 基准测试 wordpress 程序员 黑客 联邦学习 欧盟 mac 总结 流量 入门 无监督 postgres generative ai sora 解决方案 工程师 c++ 一致性 点云 spring boot 视图 redis 网络安全 pdf 硬件 swift 重建 单片机 前端 接口 多智能体 visual studio ceo git javascript kubernetes 容器 面试 cve 源码
赞助商
我也要赞助推荐或自荐