展示更少,指导更多:以定义和指南增强用于零 - shot NER 的提示
原文中文,约600字,阅读约需2分钟。发表于: 。SLIMER 是一种新的指导性指令型大型语言模型,通过使用定义和指南的提示改进了零样本命名实体识别,在未曾见过的命名实体标签上表现更好,并且在域外零样本 NER 方面表现与最先进的方法相当,同时训练数据减少。
本研究探讨了小语言模型和prompt-learning在零样本和少样本场景中的潜力。结果显示,T5-base模型在少样本设置下的准确性约为75%。集成策略对性能提升有效,FLAN-T5-large模型使用优化的提示可提高准确性近13%。研究发现小语言模型进行prompt-learning的潜力,以及主动少样本抽样和集成策略的好处。提示工程在零样本设置中也很重要。