该研究探讨了外部知识对自然语言推断系统性能的影响,发现不同来源的知识影响不同。同时,进行了最大规模、最精细的可解释NLI众包研究,揭示了自动性能分数与人的评分存在巨大差异。
完成下面两步后,将自动完成登录并继续当前操作。