CleanPatrick:图像数据清洗基准
📝
内容提要
本研究针对当前图像数据清洗基准依赖合成噪声或局限性小规模人为研究的局限,提出了CleanPatrick,这是首个基于Fitzpatrick17k皮肤病学数据集的大规模数据清洗基准。研究发现,自监督表示在近重复检测方面表现优异,而经典方法在受限复审预算下的离题检测方面具有竞争力,同时标签错误检测在细粒度医学分类中仍然面临挑战。
➡️
本研究针对当前图像数据清洗基准依赖合成噪声或局限性小规模人为研究的局限,提出了CleanPatrick,这是首个基于Fitzpatrick17k皮肤病学数据集的大规模数据清洗基准。研究发现,自监督表示在近重复检测方面表现优异,而经典方法在受限复审预算下的离题检测方面具有竞争力,同时标签错误检测在细粒度医学分类中仍然面临挑战。