小红花·文摘

本研究提出了一种层增强分类（LEC）技术，旨在提高大型语言模型在内容安全和提示注入分类中的效率。研究表明，利用小型通用语言模型的中间层作为特征提取器，可以在少量高质量样本下有效训练分类器。