HMGIE:用于视觉语言数据清洗的分层和多粒度不一致性评估

📝

内容提要

本研究解决了视觉文本不一致性评估在清洗视觉语言数据中的重要性,以往方法难以应对图像描述数据集中的多样性和不一致性。提出的HMGIE框架通过构建语义图,实现了对图像-描述对的多粒度评估,并在实验中展示了在不同数据集上的优越性能。

➡️

继续阅读