小红花·文摘

本文提出了一种通用框架，用于强大的连续假设检验，适用于多种非参数测试问题。该框架能够在线监控数据流，控制类型 I 错误，并根据未知难度调整样本大小。实证结果表明，该框架在多个任务上与专门基准测试具有竞争力。

通过选择性推断进行数据分析管道的统计检验

BriefGPT - AI 论文速递 ·

改进的日志排水过滤

Vercel News ·

本研究使用SHAP对模型解释进行了影响样本大小的研究，结果显示随着样本量的增加，解释逐渐趋于一致。集成方法具有更高的一致性，为信任解释提供指导。需要进一步研究模型类型、数据领域和解释方法。

拉什莫曼集助于医疗数据解释的探索

BriefGPT - AI 论文速递 ·

本文研究了使用单个社交网络的观测数据进行因果效应的估计和推断。考虑了样本大小增加时的依赖关系和信息传输。提出了对网络联系和结构的干预的新的因果效应，并重新分析了一个有争议的研究。在考虑网络结构后，没有发现因果同伴效应的证据。

DySuse: 动态社交网络中的易感性估计

BriefGPT - AI 论文速递 ·

本研究使用SHAP对Rashomon效应样本集中的模型进行解释，研究了样本大小对解释的影响。实验结果显示，随着样本量的增加，解释逐渐趋于一致。少于128个样本的解释具有高的变异性，限制了可靠的知识提取。集成方法通常具有更高的一致性。这些结果为信任解释提供了指导，但还需要更多研究来验证模型类型、数据领域和解释方法的收敛性。

能否达成一致？论罗生门效应与事后可解释人工智能的可靠性

BriefGPT - AI 论文速递 ·