朝着可靠的皮肤病评估基准
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该文介绍了一种资源高效的数据清洗协议,用于识别数字皮肤病学中基准数据集中的问题。该协议利用现有的算法清洗策略,并在直观的终止准则下进行确认过程。通过多位皮肤科医生的确认,移除了不相关的样本和近似重复,并估计了六个皮肤科图像数据集中标签错误的百分比。该工作为数字皮肤病学中更可靠的性能评估铺平了道路。
🎯
关键要点
-
数字皮肤病学中的基准数据集存在不准确的信息,影响模型性能评估的信任。
-
提出了一种资源高效的数据清洗协议,用于识别之前筛选中遗漏的问题。
-
该协议利用现有的算法清洗策略,并在直观的终止准则下进行确认过程。
-
通过多位皮肤科医生的确认,移除了不相关的样本和近似重复。
-
估计了六个皮肤科图像数据集中标签错误的百分比,以进行模型评估。
-
发布了每个数据集的经修订的文件列表,应用于模型评估。
-
该工作为数字皮肤病学中更可靠的性能评估铺平了道路。
➡️