常见采购词汇分类的零样本层次分类
原文中文,约300字,阅读约需1分钟。发表于: 。使用零样本研究方法,基于预训练的语言模型和标签分类法,对公共招标进行分类,并且在低频类别分类表现上优于三个不同的基线模型,并能够预测未见过的类别。
本研究评估了多种大规模多标签文本分类方法,发现基于概率标签树的层次分类方法优于Label-Wise Attention Networks。结合Transformer的方法在两个数据集上表现出色,提出了将BERT与LWANs相结合的新方法。同时,引入了图形感知注释接近度度量,改进了少量和零-shot学习的新模型。