本文介绍了一种名为Dual-Glance的模型,通过提取人物关注视线特征,结合注意力机制识别图片中的社交关系。该方法采用Adaptive Focal Loss处理模糊注释,实验结果显示其在社交关系识别中表现优异。此外,研究还提出了基于多粒度推理的框架和其他视觉关系检测方法,均在多个数据集上取得了良好效果。
完成下面两步后,将自动完成登录并继续当前操作。