真正的常识知识是什么?
原文中文,约300字,阅读约需1分钟。发表于: 。本文探讨了常识知识的模糊定义以及其在自然语言处理中的应用,指出部分常识基准测试中存在非常识知识实例的问题,影响了对模型真正常识推理能力的衡量。通过整合现有定义,提出了一个统一的常识知识定义,并在CommonsenseQA和CommonsenseQA 2.0数据集上进行实验,发现模型在常识知识实例上的表现显著低于其他实例。
本文探讨了常识知识的模糊定义及其在自然语言处理中的应用,指出常识基准测试存在的问题,影响模型的推理能力。提出统一的常识知识定义,并在CommonsenseQA和CommonsenseQA 2.0数据集上进行实验,发现模型在常识知识实例上的表现显著低于其他实例。