该论文介绍了Visual Genome数据集及其在图像描述和问答中的应用,提出了MAC网络和XNMs等新模型,强调了注意力机制在神经网络中的重要性,并探讨了提升模型解释性和视觉理解能力的方法。
完成下面两步后,将自动完成登录并继续当前操作。