本研究提出了一种层增强分类(LEC)技术,旨在提高大型语言模型在内容安全和提示注入分类中的效率。研究表明,利用小型通用语言模型的中间层作为特征提取器,可以在少量高质量样本下有效训练分类器。
完成下面两步后,将自动完成登录并继续当前操作。