本文研究了两种最先进的视觉问答方法,并通过可视化和分析它们的注意力图来评估它们的鲁棒性和缺点。研究发现这两种方法对特征敏感,但在计数和多对象相关的问题上表现不佳。这些研究结果和分析方法可以帮助改进VQA系统。
完成下面两步后,将自动完成登录并继续当前操作。