小红花·文摘

本研究提出了一种新方法来评估大型语言模型的常识智能，结果显示其能力普遍低于人类中位数，并且与人类共识的相关性适中。这强调了结合常识智能与文化背景的重要性，以帮助AI模型更好地适应不同社会知识。