小红花·文摘

大型语言模型在教育和学习应用中的使用增加，研究发现控制风格可以增加理解力，促进包容性，有助于知识蒸馏。评估了五个最先进的模型，发现性能不一致，标准偏差高。性能在一年级任务中介于五年级和八年级之间，第二个任务性能有所提高。然而，LLMs经常生成文化上不敏感的内容。提供了详细的结果分析和讨论。