数据集偏差的十年战斗:我们已经到达目标了吗?
原文中文,约400字,阅读约需1分钟。发表于: 。我们重新审视了 Torralba 和 Efros 在十年前建议的 “数据集分类” 实验,这个实验在如今大规模、多样化且希望具有更高的数据集的新时代以及更强大的神经网络架构中进行。令人惊讶的是,我们观察到现代神经网络在分类图像来自哪个数据集的问题上能够达到极高的准确率:例如,在 YFCC、CC 和 DataComp 数据集的三类分类问题的验证数据上,我们报告了 84.7%...
研究人员重新审视了十年前的“数据集分类”实验,发现现代神经网络在分类图像来自哪个数据集的问题上能够达到极高的准确率。进一步实验表明,这样的数据集分类器可以学习到具有泛化性和可转移性的语义特征,有助于重新思考数据集偏差和模型能力的问题。