小红花·文摘

本文探讨了极端多标签分类问题，提出了概率标记树（PLTs）和MACH算法，显示其在多个数据集上优于现有模型。研究还介绍了基于数据增强的分类方法和DeepXML框架，提升了分类准确性和训练效率。此外，UniDEC框架通过新方法在单GPU上实现了最先进的结果，具有良好的可扩展性。

ASTRA：基于精确可扩展的近似最近邻算法训练极端分类器

BriefGPT - AI 论文速递 ·

本文介绍了处理极端多标记分类问题的概率标记树（PLTs），并通过实现extremeText（XT）证明了PLTs在precision@k指标下是一个HSM的无遗憾多标签泛化。同时，证明了pick-one-label启发式算法在一般情况下不是一致的，XT在统计性能、模型大小和预测时间等方面与许多最先进的方法相当，适合部署在在线系统中。

ICXML: 零样本极度多标签分类的上下文学习框架

BriefGPT - AI 论文速递 ·