解放已见类别:通过锚点生成和分类重构提升少样本和零样本文本分类
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
我们提出了一个简单而有效的策略,通过利用大型预训练语言模型生成伪新样本并选择最具代表性的样本作为类别锚点,将多类分类任务转换为二元分类任务,并使用查询 - 锚点对的相似性进行预测,从而在少样本和零样本任务中充分利用有限的监督信号,实现模型从已知类别的限制中解放,能够在没有使用任何已知类别样本的情况下准确预测未知类别。
🎯
关键要点
- 提出了一种简单而有效的策略
- 利用大型预训练语言模型生成伪新样本
- 选择最具代表性的样本作为类别锚点
- 将多类分类任务转换为二元分类任务
- 使用查询 - 锚点对的相似性进行预测
- 在少样本和零样本任务中充分利用有限的监督信号
- 实现模型从已知类别的限制中解放
- 能够在没有已知类别样本的情况下准确预测未知类别
➡️