该论文提出了三个用于生成图像中人类中心视觉线索的提示,并结合多人多视角生成丰富的人类中心视觉线索,用于人物-物体交互检测。实验证明了利用这些生成的人类中心视觉线索进行交互检测的有效性,并在两个广泛使用的数据集上展示了该模型优于现有最先进方法的结果。
完成下面两步后,将自动完成登录并继续当前操作。