小红花·文摘

本研究提出了一种方法，将大型语言模型（LLMs）的知识提炼为一个更小、更高效且准确的神经网络，以实现在资源受限设备上部署这些模型的挑战。通过对测试数据集的比较，结果显示提炼的学生模型能够比原始神经网络模型获得更高的准确率。此外，学生模型的参数大小相较于原始模型减小了100倍和10倍。该研究为自动评分在典型教育环境中的运用提供了潜力。