小红花·文摘

本研究探讨了文本分类中的标签选择问题，比较了层次文本分类（HTC）与极端多标签分类（XML）模型在不同标签池上的表现，结果显示HTC在XML数据集上效果不佳，而XML在HTC数据集上表现较好，为跨域分类方法的发展提供了重要见解。

Hierarchical Text Classification (HTC) and Extreme Multi-Label Classification (XML): Two Sides of the Same Coin

BriefGPT - AI 论文速递 ·

本文探讨了极端多标签分类问题，提出了概率标记树（PLTs）和MACH算法，显示其在多个数据集上优于现有模型。研究还介绍了基于数据增强的分类方法和DeepXML框架，提升了分类准确性和训练效率。此外，UniDEC框架通过新方法在单GPU上实现了最先进的结果，具有良好的可扩展性。

ASTRA：基于精确可扩展的近似最近邻算法训练极端分类器

BriefGPT - AI 论文速递 ·

本文介绍了一种新算法用于极端多标签分类（XMC），结合数据增强和预训练模型，显著提升了分类效果。Gandalf通过标签共现图和短文本特性，在少量训练实例下超越传统模型，尤其在尾部标签表现突出。此外，GROOV模型可预测开放词汇标签，XR-Transformer加速了大标签空间的微调，提高了训练速度和准确率。

随机循环向量的多标签学习

BriefGPT - AI 论文速递 ·