朝着可靠的皮肤病评估基准
原文中文,约400字,阅读约需1分钟。发表于: 。数字皮肤病学中的基准数据集不知不觉地包含了不准确的信息,这减少了对模型性能评估的信任。我们提出一种资源高效的数据清洗协议,用于识别之前筛选中遗漏的问题。该协议利用现有的算法清洗策略,并在直观的终止准则下进行确认过程。基于多位皮肤科医生的确认,我们移除了不相关的样本和近似重复,并估计了由国际皮肤影像协作组推广的六个皮肤科图像数据集中标签错误的百分比,以进行模型评估。随着本文的发布,我们为每个数...
该文介绍了一种资源高效的数据清洗协议,用于识别数字皮肤病学中基准数据集中的问题。该协议利用现有的算法清洗策略,并在直观的终止准则下进行确认过程。通过多位皮肤科医生的确认,移除了不相关的样本和近似重复,并估计了六个皮肤科图像数据集中标签错误的百分比。该工作为数字皮肤病学中更可靠的性能评估铺平了道路。