多粒度组合视觉线索学习用于图像意图识别
📝
内容提要
本研究旨在解决传统计算机视觉任务无法有效识别图像中隐含意图的问题,提出了多粒度组合视觉线索学习(MCCL)方法,结合多种视觉特征进行意图识别。通过将意图识别视为多标签分类问题,采用图卷积网络来增强标签嵌入的相关性,显著提高了图像意图识别的准确性和可解释性,为理解复杂的人类表达形式奠定了基础。
➡️
本研究旨在解决传统计算机视觉任务无法有效识别图像中隐含意图的问题,提出了多粒度组合视觉线索学习(MCCL)方法,结合多种视觉特征进行意图识别。通过将意图识别视为多标签分类问题,采用图卷积网络来增强标签嵌入的相关性,显著提高了图像意图识别的准确性和可解释性,为理解复杂的人类表达形式奠定了基础。