从社会认知角度看:上下文感知的视觉社交关系识别
原文中文,约300字,阅读约需1分钟。发表于: 。通过结合社会认知角度,该研究提出了一种新的方法,ConSoR,以从视觉中识别上下文化的社会关系,并通过多模态适配器和视觉 - 语言对比机制加强对决定性视觉社会因素的识别,从而在 PISC 数据集上实现了 12.2%的提升和 PIPA 基准上的 9.8%提高,更可靠地揭示社会关系。
该研究提出了一种新的方法ConSoR,通过结合社会认知角度,从视觉中识别上下文化的社会关系,并通过多模态适配器和视觉-语言对比机制加强对决定性视觉社会因素的识别。在PISC数据集上实现了12.2%的提升和PIPA基准上的9.8%提高,更可靠地揭示社会关系。