有限预算下快速学习的最佳臂识别
原文中文,约600字,阅读约需2分钟。发表于: 。在大型语言模型中,显著的指导遵循能力引发了对自动学习合适提示的日益关注。本研究通过在提示学习中显式引入有限预算约束,提出了一种统一的框架 TRIPLE(用于提示学习的最佳臂识别),并通过利用聚类和函数逼近的思想对其进行了两种基于嵌入的增强。广泛的实验表明,TRIPLE 在满足有限预算限制的同时,相对于之前的基线方法在多个任务上都取得了显著的性能提升。
本研究调查了小语言模型与prompt-learning在零售业中客户-代理商互动的文本分类中的潜力。结果显示,小语言模型T5-base在少样本设置下可以实现约75%的准确性。集成策略和优化提示可以显著提升性能。使用小语言模型进行prompt-learning的分类任务具有潜力,主动少样本抽样和集成策略对少样本设置有好处,提示工程在零样本设置中很重要。