不要浪费时间:早停止交叉验证

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究评估了多源数据环境下的交叉验证方法,发现留源交叉验证提供了更可靠的性能估计。研究强调了医学数据上误导性交叉验证结果的危害,并提出了减轻问题的方法。

🎯

关键要点

  • 研究评估了多源数据环境下的标准 K 折交叉验证和留源交叉验证方法。

  • 研究聚焦于基于心电图的心血管疾病分类任务。

  • 整合了 PhysioNet CinC Challenge 2021 和山东省医院的公开数据集。

  • K 折交叉验证在推广到新数据源时系统性高估预测性能。

  • 留源交叉验证提供了更可靠的性能估计,偏差接近零但可变性较大。

  • 研究强调了医学数据上误导性交叉验证结果的危害。

  • 提出了在多源数据情况下减轻交叉验证问题的方法。

➡️

继续阅读