从观察者注视中学习:基于人物 - 物体交互识别的零样本注意预测
原文中文,约400字,阅读约需1分钟。发表于: 。在这项研究中,我们首先收集了一个名为 IG 的新型凝视固定点数据集,包括来自 740 个不同的互动类别的 53 万个凝视固定点,捕捉到人类观察者在认知互动过程中的视觉注意。然后,我们引入了零样本的面向互动注意力预测任务 ZeroIA,通过挑战模型在训练过程中未遇到的互动中预测视觉线索。我们提出了交互式注意力模型 IA,旨在模拟人类观察者的认知过程来解决 ZeroIA...
该研究收集了一个名为IG的凝视固定点数据集,包括来自740个不同互动类别的53万个凝视固定点。研究提出了零样本的面向互动注意力预测任务ZeroIA,并引入了交互式注意力模型IA来解决该问题。实验结果表明,IA模型在ZeroIA和完全监督的环境中都优于其他方法。研究还将面向互动注意力应用于互动识别任务,提高了现有最先进的HOI模型的性能和可解释性。