探索基于提示学习范式的小型语言模型用于高效的领域特定文本分类
原文约600字/词,阅读约需2分钟。发表于: 。在本研究中,我们调查了小语言模型(具有不到 10 亿参数)与 prompt-learning 范例相结合,在零样本和少样本场景下针对零售业中客户 - 代理商互动的领域特定文本分类的潜力。我们的评估结果显示,在少样本设置下进行基于提示的模型微调时,220M 参数的典型小语言模型 T5-base 可以在有限的标记数据(高达全数据的 15%)上实现约 75% 的准确性,显示了小语言模型与...
本研究探讨了小语言模型与prompt-learning的结合在零样本和少样本场景下针对零售业中客户-代理商互动的领域特定文本分类的潜力。评估结果显示,T5-base小语言模型可以在有限的标记数据上实现约75%的准确性,强调了小语言模型与prompt-learning的巨大潜力。同时,强调了主动少样本抽样和集成策略在少样本设置中的好处,并强调了零样本设置中提示工程的重要性。