重新措辞的标签提升零样本文本分类性能30%
原文英文,约3500词,阅读约需13分钟。发表于: 。When using embedding models for zero-shot classification, rephrasing the class label to "This is seriously about 'LABEL'" gives higher accuracy vs. using LABEL alone. But how, and why?
本文讨论了在零样本设置下使用嵌入模型进行分类任务的问题,提出了一种简单但有效的方法。作者通过嵌入模型计算数据和候选标签之间的余弦相似度,并选择最大相似度的标签作为分类结果。实验结果表明,通过重新构造标签可以显著提高零样本分类性能,但在某些情况下效果不理想。