本研究提出SayCoNav方法,解决自主机器人在复杂导航任务中的协作策略适应性不足问题。实验结果显示,该方法的搜索效率提高了最多44.28%。
本研究提出了SCOUT(情境理解交易语料库),旨在促进人机互动研究,优化协作探索任务中的导航沟通。
本研究提出了聚类式联邦学习框架Fed-EC,解决了传统模型在不同环境中的应用不均问题。该框架显著降低了通信带宽需求(减少23倍),在导航任务中表现优于局部学习,且与集中式学习相当。
本文提出了一种新理论框架,将有限代理人的状态表示学习与目标导向结合。通过定义目标状态表示的可控性,研究粒度与策略复杂性之间的权衡。算法在导航任务中有效,强调忽略某些信息以学习简单灵活的状态表示,为自然和人工学习提供统一视角。
本研究提出ReLIC方法,帮助智能体在新环境中快速适应。ReLIC利用64,000步的上下文经验进行强化学习,结合部分更新策略和Sink-KV机制,使智能体高效学习新任务。结果显示,ReLIC在多目标导航任务中表现优于多种元强化学习基线,并具备一定的模仿学习能力。
该研究开发了一个语言引导的导航任务,通过执行低级动作来遵循自然语言导航方向,消除了以前关于环境的假设。研究发现,在连续三维环境中的性能明显较低,表明以前的导航-图形设定中的性能可能被过高评价了。
该研究开发了一个语言引导的导航任务,通过执行低级动作来遵循自然语言导航方向,消除了以前关于环境的假设。研究发现,在连续环境中的性能较低,表明以前的“导航-图形”设定中的性能可能被过高评价了。
本研究提出了基于图卷积网络的两种奖励形状方法的改进方案,验证了其在稀疏奖励情况下提高导航任务上深度强化学习算法的收敛性和可解释性。
该研究使用Feudal HRL算法,通过紧密的表示发现目标表示的发展机制,并同时学习目标表示和分层策略。在复杂的导航任务上评估,结果表明所学到的表示是可解释的、可传递的,并且可以实现高效的学习。
该研究开发了一个语言引导的导航任务,消除了以前关于环境的假设。通过模拟以前的工作并进行单模态基线测试,发现在连续环境中的性能明显较低,表明以前的“导航-图形”设定中的性能可能被过高评价。
本研究使用监督混合量子机器学习方法优化自然灾害期间的汽车紧急疏散计划。通过建模动态计算图,在城市图上测试了新型混合监督学习方法。使用量子特征线性调制(FiLM)神经网络,成功学习了导航任务。相较于纯经典监督学习方法,量子部分提高了7%的准确性,并在预测中有45.3%的重要贡献度。研究结果显示,监督混合量子机器学习有助于改善自然灾害期间的紧急疏散计划。
完成下面两步后,将自动完成登录并继续当前操作。