本文提出了一种通用框架,用于强大的连续假设检验,适用于多种非参数测试问题。该框架能够在线监控数据流,控制类型 I 错误,并根据未知难度调整样本大小。实证结果表明,该框架在多个任务上与专门基准测试具有竞争力。
日志排水现已通过仪表板和API支持环境过滤(生产或预览)及样本大小配置,以减少吞吐量。详细信息请参阅文档。
本研究使用SHAP对模型解释进行了影响样本大小的研究,结果显示随着样本量的增加,解释逐渐趋于一致。集成方法具有更高的一致性,为信任解释提供指导。需要进一步研究模型类型、数据领域和解释方法。
本文研究了使用单个社交网络的观测数据进行因果效应的估计和推断。考虑了样本大小增加时的依赖关系和信息传输。提出了对网络联系和结构的干预的新的因果效应,并重新分析了一个有争议的研究。在考虑网络结构后,没有发现因果同伴效应的证据。
本研究使用SHAP对Rashomon效应样本集中的模型进行解释,研究了样本大小对解释的影响。实验结果显示,随着样本量的增加,解释逐渐趋于一致。少于128个样本的解释具有高的变异性,限制了可靠的知识提取。集成方法通常具有更高的一致性。这些结果为信任解释提供了指导,但还需要更多研究来验证模型类型、数据领域和解释方法的收敛性。
完成下面两步后,将自动完成登录并继续当前操作。