VEglue: 通过对象对齐的联合消除测试视觉蕴涵系统
原文中文,约400字,阅读约需1分钟。发表于: 。VEglue 是一种用于 VE 系统测试的基于对象对齐的联合擦除方法,它能检测出平均 11609 个问题,比基线方法高出 194%-2846%,并在平均下降 17.1%-38.2% 的情况下,显著提高模型性能(准确率增加了 50.8%)。
本文介绍了视觉蕴含(VE)任务及其与传统文本蕴含(TE)任务的区别。提出了SNLI-VE数据集和可解释的视觉蕴含模型(EVE)。通过在SNLI-VE数据集上评估EVE和其他VQA模型,揭示了现代VQA模型性能的见解。