本研究将离散子集采样方法应用于图基视觉问答系统,以提升模型的可解释性和回答准确性。研究结果表明,这些方法有效减轻了可解释性与性能之间的权衡,并与人类评价结果高度一致。
本文研究了与人类评价相关的度量标准,并提出了新的度量标准MoBERT。通过人类评价发现,目前用于此任务的度量标准与人类判断相关性较低,而常用的度量标准和坐标误差与人类判断相关性较高。不推荐使用一些最近开发的度量标准。结果显示,MoBERT在样本级别和模型级别上与人类判断相关性高,优于当前所有替代方案。
完成下面两步后,将自动完成登录并继续当前操作。