BriefGPT - AI 论文速递 ·

ASTRA：基于精确可扩展的近似最近邻算法训练极端分类器

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

本文探讨了极端多标签分类问题，提出了概率标记树（PLTs）和MACH算法，显示其在多个数据集上优于现有模型。研究还介绍了基于数据增强的分类方法和DeepXML框架，提升了分类准确性和训练效率。此外，UniDEC框架通过新方法在单GPU上实现了最先进的结果，具有良好的可扩展性。

🎯

🔎

极端多标签分类（XMC）面临着内存和计算资源的巨大挑战。本文提出的MACH算法和ECLARE算法通过优化内存占用和引入标签相关性，显著提高了分类准确性和训练效率。这些方法为处理海量标签的实时预测提供了新的思路，适合在资源受限的环境中应用。

基于数据增强的分类方法利用预训练的GPT-2生成无标记扰动，结合RoBERTa的标签注意分类器，取得了优异的效果。这种方法不仅提升了模型的泛化能力，还能有效扩展训练数据集，适用于多种实际应用场景，尤其是在数据稀缺的情况下。

UniDEC框架通过端到端训练和Pick-Some-Label方法，在单GPU上实现了极端多标签分类的最先进结果。其良好的可扩展性使得在百万标签规模的数据集上也能高效运行，适合需要快速响应的在线系统。这一创新为未来的极端分类研究提供了新的方向。

❓

概率标记树（PLTs）是一种用于处理极端多标签分类问题的模型，能够在precision@k指标下实现无遗憾多标签泛化。

MACH算法在6个数据集上测试显示出优于现有分类模型的性能，降低了内存占用并加快了训练速度。

DeepXML框架将深度极端多标签任务分解为四个子任务，从而提高了训练速度和准确性。

ECLARE算法通过引入标签相关性来提高分类准确性，适用于海量标签的实时预测。

UniDEC框架通过多类损失进行端到端训练，并采用Pick-Some-Label方法，在单GPU上实现了最先进的结果，具有良好的可扩展性。

该方法利用预训练的GPT-2生成无标记扰动，结合RoBERTa的标签注意分类器，以增强现有训练数据。

🏷️