本研究通过引入Shapley交互(SIs)解决了Shapley值在特征归因和数据估值中的局限性,提升了对黑箱模型的理解。shapiq是一个开源Python包,整合算法,高效计算Shapley值和SIs,并提供基准测试工具评估性能。
本文介绍了一种新的数据估值框架OpenDataVal,利用Wasserstein距离和敏感性分析方法,能够有效识别低质量数据并提升性能。该框架支持多种数据估价算法的比较,并通过实验验证了其有效性。此外,介绍了高效聚类框架SkeVa family和新数据评估方法Data-OOB,均在大规模数据集上表现优异。
完成下面两步后,将自动完成登录并继续当前操作。