本研究探讨了文本分类中的标签选择问题,比较了层次文本分类(HTC)与极端多标签分类(XML)模型在不同标签池上的表现,结果显示HTC在XML数据集上效果不佳,而XML在HTC数据集上表现较好,为跨域分类方法的发展提供了重要见解。
本文介绍了多种层次文本分类方法,如HTCInfoMax、HGCLR、HBGL、HiTIN、HJCL和HiGen,旨在解决标签不平衡和噪声引入等问题。这些方法在多个数据集上表现出显著的性能提升。
本文介绍了HJCL、HGCLR、HiTIN等多种层次文本分类方法,旨在解决半监督学习中的噪声问题和标签不平衡。这些方法在多个数据集上表现出显著的性能提升,尤其在处理复杂分类结构和提高分类效果方面。
该论文提出了一种新型神经网络HiTIN,用于层次文本分类。主要创新点是将类别层级树结构转换成新的树结构coding tree。通过GNN在coding tree上递归地获得节点的embedding,最后做pooling并经过线性层得到最终logits。结果表明,相比其他网络,本网络参数少且效果好。此外,论文提出了递归正则化等通用技巧。
完成下面两步后,将自动完成登录并继续当前操作。