不要浪费时间:早停止交叉验证
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究评估了多源数据环境下的交叉验证方法,发现留源交叉验证提供了更可靠的性能估计。研究强调了医学数据上误导性交叉验证结果的危害,并提出了减轻问题的方法。
🎯
关键要点
-
研究评估了多源数据环境下的标准 K 折交叉验证和留源交叉验证方法。
-
研究聚焦于基于心电图的心血管疾病分类任务。
-
整合了 PhysioNet CinC Challenge 2021 和山东省医院的公开数据集。
-
K 折交叉验证在推广到新数据源时系统性高估预测性能。
-
留源交叉验证提供了更可靠的性能估计,偏差接近零但可变性较大。
-
研究强调了医学数据上误导性交叉验证结果的危害。
-
提出了在多源数据情况下减轻交叉验证问题的方法。
➡️