本文提出了一种结合对抗性模仿学习和强化学习的系统,用于训练物理模拟角色在复杂场景中的交互任务。该系统无需手动注释数据,能够处理未见物体和场景。研究还提出了层次生成框架和新的运动综合方法,显著提高了运动生成的质量和准确性,实验结果优于现有方法。
EMMA是一种编码-解码模型,能够处理交互和具身任务,并在Alexa Arena中的对话引导代理中取得了新的最佳结果。
该研究提出了一种神经符号化方法,用于解决神经网络特征提取对小的改变过于敏感而未能适应测试集中未见过的属性和指令的问题。实验结果表明,该方法在 ALFRED 基准测试的子任务评估中,相比端到端的神经模型,在未知环境下的交互任务中显着优于前者。
完成下面两步后,将自动完成登录并继续当前操作。