何时重采样/重加权能改善不平衡分类中的特征学习?玩具模型研究

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该研究分析了高维情况下线性分类器的泛化曲线表达式,并研究了数据的类别不平衡性、时刻和性能指标的影响。实验结果验证了欠采样和过采样混合策略对性能的提升。

🎯

关键要点

  • 研究分析了高维情况下线性分类器的泛化曲线表达式。
  • 探讨了数据的类别不平衡性对分类器性能的影响。
  • 研究了数据的第一和第二时刻对分类器的影响。
  • 提出了欠采样和过采样混合策略可以提升分类器性能。
  • 通过数值实验验证了理论预测在真实数据集上的相关性。
➡️

继续阅读