BriefGPT - AI 论文速递 ·

可解释机器学习预测的无标签或特征泄漏的本地特征选择

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

本文介绍了十种特征归因方法，包括七种依赖类别的方法和三种分布感知的方法。提出了SHAP-KL和FastSHAP-KL两种新方法，并在多个临床数据集上评估了其在特征选择和模型解释中的有效性。

🎯

❓

SHAP-KL和FastSHAP-KL是两种新提出的分布感知特征归因方法，主要用于计算Shapley值，评估特征选择和模型解释的有效性。

无监督特征选择的图形方法通过计算稳健的伪标签并训练代理模型，揭示数据集的异质性来源，从而提高下游分析的精度。

MAPLE模型解释系统结合局部线性建模和随机森林技术，提供高精度的预测和优越的局部解释能力，适用于黑盒模型的解释。

Access-MFS方法解决了高维度多标签数据中的维数灾难问题，通过选择具有区分性但无关的特征，提高特征选择性能。

选择性解释的特征归因方法通过检测低质量解释并使用初始猜测技术进行改善，使得实践者能够选择更高质量的解释。

该算法将特征子集视为图上的路径，执行排名步骤并建模相关性，从而在特征选择领域设定新的最佳状态。

🏷️