小红花·文摘

本研究通过实验设计和策略分析，旨在识别最佳治疗方案并减少误判概率。提出了一种在自适应实验中估计方差的策略，研究了在差分隐私约束下的线性赌臂问题，构建了满足隐私约束的策略，并提供了相关的错误概率上下限。此外，探讨了在线线性赌臂问题中的最佳臂识别算法，提出了有效的好臂识别算法，并证明了其样本复杂度的理论下限。