通过符号世界知识从自我中心视角定位活动对象
原文中文,约300字,阅读约需1分钟。发表于: 。通过学习任务指令的对象信息、利用对象的动作前后条件和描述性知识,我们提出了一种改进短语定位模型的方法,通过大型语言模型来提取动作 - 对象知识,并设计了一种对象短语和符号知识的联合推理技术,实验证明我们的方法在各项指标上都取得了显著的改善。
该研究提出了一种神经符号化方法,用于解决神经网络特征提取对小的改变过于敏感而未能适应测试集中未见过的属性和指令的问题。实验结果表明,该方法在 ALFRED 基准测试的子任务评估中,相比端到端的神经模型,在未知环境下的交互任务中显着优于前者。