dopanim: 一个来自多个人的包含噪音注释的动物良种数据集
原文中文,约300字,阅读约需1分钟。发表于: 。研究提供了一个新的基准数据集,其中包含大约 15,750 张动物图像,涉及 15 个类别,并附有真实标签。该数据集旨在用于对抗含噪注释的方法研究,以适应机器学习模型的训练和泛化性能。研究试用了人类评估的概率注释和注释者元数据,对七个变种的数据集进行了评估,并提出了其他评估用例,如学习超越硬类别标签和主动学习。所有的实验结果和完整的代码库均可公开获取和复现。
该研究提供了一个包含15,750张动物图像的新数据集,涉及15个类别,并附有真实标签。该数据集用于研究对抗含噪注释的方法,以提高机器学习模型的训练和泛化性能。研究使用了人类评估的概率注释和注释者元数据,并对七个变种的数据集进行了评估。此外,还提出了其他评估用例,如学习超越硬类别标签和主动学习。实验结果和代码库可公开获取和复现。