CHG Shapley: 高效的数据评估与选择,迈向可靠的机器学习
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究通过计算数据子集对模型准确性的效用近似值,推导出了CHG评分的Shapley值闭式表达式,提高了计算效率。利用CHG Shapley进行实时数据选择,证明其在识别高价值和有噪声数据方面的有效性。该方法为信任值机器学习引入了一种新的以数据为中心的视角。
🎯
关键要点
-
通过计算数据子集对模型准确性的效用近似值,推导出CHG评分的Shapley值闭式表达式。
-
在大规模数据集上将数据估值方法从多次模型重训练改进为单次模型重训练,显著提高计算效率。
-
利用CHG Shapley进行实时数据选择,证明其在识别高价值和有噪声数据方面的有效性。
-
CHG Shapley促进了可信的模型训练,为信任值机器学习引入了一种新的以数据为中心的视角。
➡️