BriefGPT - AI 论文速递 ·

噪声和变化标签分布下的在线多标签分类

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文提出了多种新方法解决多标签分类中的噪声标签和类别不平衡问题，包括统一蒸馏框架、分布平衡损失函数和正例与未标注多标签分类（PU-MLC）。实验证明这些方法在新创建的数据集上具有更高的有效性和鲁棒性，推动了多标签学习的研究进展。

🎯

🔎

统一蒸馏框架通过结合干净数据集和知识图谱中的标签关系，有效降低了学习过程中的风险。这种方法不仅提升了模型的鲁棒性，还为处理噪声标签提供了新的思路，适合在数据质量不高的情况下使用。

分布平衡损失函数专门针对长尾类分布和标签共现问题，实验结果显示其在多标签分类中优于传统损失函数。这一方法特别适合于类别不平衡的场景，能够显著提高分类的准确性和稳定性。

正例与未标注多标签分类（PU-MLC）方法通过丢弃负标签来减少噪声影响，结合自适应重平衡因子，能够有效应对标签分布的不平衡。这一创新为多标签学习提供了新的解决方案，尤其在处理复杂数据集时表现出色。

❓

统一蒸馏框架利用小的干净数据集和知识图谱中的标签关系来降低学习风险。

分布平衡损失函数用于解决长尾类分布、标签共现和负标签占主导的问题。

PU-MLC方法通过丢弃负标签来减少噪声标签的影响，并引入自适应重平衡因子。

PLT-MLC任务和CO-MIC-Balance框架旨在同时解决长尾分布和部分标签的多标签分类问题。

可以通过基于神经网络的方法和选择性概念漂移适应机制来提高多标签分类的鲁棒性。

深度学习在多标签学习中的进展包括深度神经网络、转换器、自编码器等多种架构。

🏷️