本研究提出了一种新方法,解决了有限样本下变量重要性度量的敏感性和不稳定性问题,从而增强了推断的稳健性和准确性。
变量重要性在可解释机器学习中起关键作用。研究评估了解决变量重要性评估中特征相关性问题的方法,发现处理高特征相关性时存在困难和方法的实用性和局限性。
本文提出了一种基于Shapley种群变量重要性度量的变量重要性估计器,通过随机采样减少计算复杂度,并证明了其在渐进意义下收敛的最佳速率,可以建立有效的置信区间和假设检验。在模拟实验和真实数据集上均表现出好的性能。
完成下面两步后,将自动完成登录并继续当前操作。