SMOTE 的理论和实验研究:再平衡策略的限制和比较
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
SMOTE是处理不平衡数据集的常见重平衡策略,能通过复制原始少数样本来重新生成原始分布。新的SMOTE相关策略与最先进的重平衡程序进行比较,只有在数据集高度不平衡时才需要重平衡策略。
🎯
关键要点
- SMOTE 是处理不平衡数据集的常见重平衡策略。
- SMOTE 通过复制原始少数样本来重新生成原始分布。
- 在少数分布边界附近,SMOTE 密度消失,验证了常见的边界 SMOTE 策略。
- 介绍了两种新的 SMOTE 相关策略,并与最先进的重平衡程序进行比较。
- 只有在数据集高度不平衡时才需要重平衡策略。
- 对于高度不平衡的数据集,SMOTE、提议的策略或欠采样程序是最佳策略。
➡️