本研究针对LLM代理在未知环境中的行动与学习能力不足,提出了基于经济学的决策任务基准及新测量方法,以评估其在复杂经济问题中的表现。
本研究提出了一种新方法,通过指令中的隐含子目标的视觉表征,提升视觉与语言导航代理在未知环境中的导航性能,显著提高成功率和成功比例。
本研究提出了一种新方法,通过基于得分的图生成策略来缓解训练和测试数据集间的分布漂移问题。该方法有效合成未知环境特征,提升图学习模型的分布外泛化能力,实验结果表明其有效性显著。
本文介绍了一种基于强化学习的本地导航策略,可以帮助四足机器人在未知环境中可靠导航,即使在感知出现故障时也能进行端到端的环境重建和响应。
本文提出了一种无地图的移动机器人规避导航的预训练深度强化学习方法,通过将原始传感器数据映射到控制变量并在未知环境中导航。实验证明我们的 DRL 模型具有在不同环境下的通用性能。
本文提出了一种新的方法来缓解领域泛化的挑战,即在未知环境中保持强大的结果。该方法集中于最终分类器层的决策过程,通过将对最终结果的逐元素贡献视为决策的依据,并将每个样本的理由表示为矩阵。为了实现良好泛化的模型,提出了一个新的规则不变损失作为一种简单的正则化技术。实验证明该方法在各种数据集上取得了有竞争力的结果。
完成下面两步后,将自动完成登录并继续当前操作。