本研究提出了一种新方法来评估大型语言模型的常识智能,结果显示其能力普遍低于人类中位数,并且与人类共识的相关性适中。这强调了结合常识智能与文化背景的重要性,以帮助AI模型更好地适应不同社会知识。
完成下面两步后,将自动完成登录并继续当前操作。