一种基于信息熵和轮盘选择的新型双重剪枝方法用于乳腺癌诊断的不平衡数据

📝

内容提要

本研究解决了癌症诊断中数据不平衡带来的分类器性能和可靠性问题,提出了RE-SMOTEBoost方法。该方法通过优先在重叠区域生成合成样本、信息熵过滤机制减少噪声并引入双重正则化惩罚,有效提高了少数类样本的质量。结果表明,RE-SMOTEBoost在不平衡数据集上相较于现有技术有显著提升,证明了其在医疗应用中的潜在影响。

➡️

继续阅读