数据集子集选择以实现专业化

本研究针对机器学习应用中训练数据分布与特定部署的数据分布之间的不匹配问题,提出了一种数据集子集选择的方法(DS3),旨在优化部署性能。研究发现,专门为特定部署手动策划的数据子集在准确性上比使用所有可用数据进行训练的表现提高了51.3%。

发表于:
阅读原文