真正的常识知识是什么？

原文中文，约300字，阅读约需1分钟。发表于：。

本文探讨了常识知识的模糊定义以及其在自然语言处理中的应用，指出部分常识基准测试中存在非常识知识实例的问题，影响了对模型真正常识推理能力的衡量。通过整合现有定义，提出了一个统一的常识知识定义，并在CommonsenseQA和CommonsenseQA 2.0数据集上进行实验，发现模型在常识知识实例上的表现显著低于其他实例。

本文探讨了常识知识的模糊定义及其在自然语言处理中的应用，指出常识基准测试存在的问题，影响模型的推理能力。提出统一的常识知识定义，并在CommonsenseQA和CommonsenseQA 2.0数据集上进行实验，发现模型在常识知识实例上的表现显著低于其他实例。