本研究提出了一种名为RAMEN的替代模型,通过替换图卷积网络为非图卷积网络的架构,利用图数据来规范编码器训练,提高标签极度分类任务的性能。该模型在基准数据集上获得了高达15%的预测准确率提升,同时不增加推断计算成本。
本文提出了一种基于二元分类的简单替代模型来解决视觉问答中的问题。作者发现现有的视觉问答系统性能的瓶颈可能在于对问题及答案中基础概念的不足认知。
完成下面两步后,将自动完成登录并继续当前操作。