小红花·文摘

本研究探讨了大型语言模型在理解自然语言时的评估难题，特别是在传达抽象意义方面的局限性。通过构式语法构建的评估集显示，最新模型在捕捉抽象意义上仍面临挑战，突显其语义能力的关键局限性。