小红花·文摘

本文介绍了一种名为Dual-Glance的模型，通过提取人物关注视线特征，结合注意力机制识别图片中的社交关系。该方法采用Adaptive Focal Loss处理模糊注释，实验结果显示其在社交关系识别中表现优异。此外，研究还提出了基于多粒度推理的框架和其他视觉关系检测方法，均在多个数据集上取得了良好效果。

从社会认知角度看：上下文感知的视觉社交关系识别

BriefGPT - AI 论文速递 ·

该研究探讨了基于图神经网络的多目标跟踪和视觉关系检测算法，展示了其在运动对象分割、人物重识别和视频交互识别等领域的优越性，显著提高了检测的准确性和效率。

I-MPN: 用于移动眼动数据有效和高效的人机交互标注的归纳式消息传递网络

BriefGPT - AI 论文速递 ·

本文提出了一种新型场景图生成算法，结合外部知识和图像重建损失，提升场景图的可推广性，并解决嘈杂对象注释偏差问题。实验结果表明，该框架在“视觉关系检测”和“视觉基因组”数据集上表现优异。

外部知识增强的基于草图的三维场景生成

BriefGPT - AI 论文速递 ·

本研究提出了一种自然语言引导的框架，结合双向循环神经网络和语义连接进行视觉关系检测，特别在未预测关系上表现优异。通过整合视觉和语义特征，改进了零样本预测技术，并在多个数据集上取得最佳性能，提升了图像理解和检索的准确性。

场景图 ViT：端到端开放词汇视觉关系检测

BriefGPT - AI 论文速递 ·