BriefGPT - AI 论文速递 ·

基于提升度的排名：大规模 A/B 测试的成本效益方法

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文提出了一种基于最佳臂多臂老虎机的连续监控框架，替代传统A/B测试，以控制虚假发现率(FDR)。通过分层贝叶斯估计和自适应多重检验方法，解决了多因素相关性和早期停止等问题，提升了信号检测能力。此外，研究探讨了在线控制FDR的广义Alpha-investing过程及其改进，提供了新的假阳性发现比例控制方法。

🎯

关键要点

提出了一种基于最佳臂多臂老虎机的连续监控框架，替代传统A/B测试。
该框架利用在线虚警率控制算法和顺序p值，实现样本优化和低虚假发现率(FDR)。
通过分层贝叶斯估计方法，解决了多因素相关性和早期停止等问题，提升了信号检测能力。
研究了在线控制FDR的广义Alpha-investing过程，证明其在特定条件下能控制FDR和假阳性探查率。
提出了一种新的自适应多重检验方法，控制有限样本下的误差发现率，采用广义Storey估计和加权版本。
阐述了Benjamini Hochberg定理的反转，提供了新的假阳性发现比例控制方法。

❓

延伸问答

什么是基于最佳臂多臂老虎机的连续监控框架？

这是一个替代传统A/B测试的新框架，利用在线虚警率控制算法和顺序p值，实现样本优化和低虚假发现率(FDR)。

如何解决A/B测试中的多因素相关性问题？

通过分层贝叶斯估计方法，可以有效解决多因素相关性和早期停止等问题，提升信号检测能力。

广义Alpha-investing过程的作用是什么？

该过程用于在线控制FDR，能够在特定条件下控制假阳性探查率。

新提出的自适应多重检验方法有什么特点？

该方法依靠真空假设数量的估计，控制有限样本下的误差发现率，采用广义Storey估计和加权版本。

Benjamini Hochberg定理的反转有什么意义？

反转该定理提供了一种新的假阳性发现比例控制方法，增强了多重检验的有效性。

如何通过历史数据评估新推荐系统的收益？

可以计算新版本可能带来的收益提升，并通过在线广告个性化产品推荐进行商业实验来检验这些估计值。

🏷️