提取清洁平衡的子集以用于嘈杂的长尾分类

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

使用分布匹配和最优传输的伪标注方法解决了长尾分布和标签噪声的问题,提供平衡准确的训练样本集,为标签噪声的长尾分类提供性能提升。

🎯

关键要点

  • 使用基于分布匹配的类原型和最优传输的伪标注方法。
  • 结合观察标签和伪标签的有效筛选标准。
  • 成功解决了长尾分布和标签噪声的联合问题。
  • 提供了更加平衡、准确的训练样本集。
  • 为具有标签噪声的长尾分类提供了有效的性能提升。
➡️

继续阅读