BriefGPT - AI 论文速递 ·

WeShap: 使用 Shapley 值对弱监督源进行评估

💡 原文中文，约1300字，阅读约需3分钟。

📝

内容提要

本文综述了程序化弱监督（PWS）的重要进展，介绍了相关方法及其在有限标记数据中的应用，探讨了关键挑战和未来研究方向。研究提出了新框架PWSHAP和概率Shapley值，以提高机器学习模型的性能和效率，减轻手动标注负担。

🎯

❓

程序化弱监督（PWS）是一种学习范式，旨在利用有限标记数据进行有效的机器学习。

PWSHAP框架用于评估复杂结果模型中二元变量的有针对性影响，并保持对敌对攻击的鲁棒性。

概率Shapley值（P-Shapley）用于量化每个数据点对概率分类器的边际贡献，以提高机器学习模型的可用性和可信赖性。

通过基于生成模型的自动标注方法，弱监督学习可以减少手动标注的需求，提高机器学习项目的生产效率。

这种方法显著提高了近似速度和评估效率，最高可达9.9倍，同时保持数据的近似价值和排名。

LLpowershap是一种基于损失的Shapley值特征选择方法，能够识别更多有信息特征且输出噪声特征较少。

🏷️