本研究提出了一种名为ARCHIE的自主强化学习方法,利用GPT-4从自然语言任务描述生成奖励函数,解决复杂人机协作中的奖励函数设计难题。实验结果表明,该方法能够有效将人类可读文本转化为可部署的机器人技能。
本研究提出了一种开放词汇的空间-语义扩散策略(S$^2$-扩散),旨在解决机器人技能学习的实例局限性。实验结果表明,该方法在类别无关因素变化时仍能保持良好性能,并有效地将技能转移至同类实例。
研究团队提出了一种基于忆阻器的深度贝叶斯主动学习(DBAL)方法,显著提高了标记效率并降低了成本。该方法在内存计算框架中实现,相较于传统硬件速度提升44%,节能153倍,适用于机器人技能学习等任务。
完成下面两步后,将自动完成登录并继续当前操作。