本研究提出了一种新算法“物流跟踪与停止”(Log-TS),旨在解决广义线性模型老虎机中的纯探索问题。该算法有效接近样本复杂度的期望下界,展示了其在纯探索中的潜在影响。
本文研究高维机器学习中的广义线性模型,探讨贝叶斯最优估计、模型性能评估及过拟合问题。提出新正则化方法Fishr,以提升模型的鲁棒性和泛化能力。研究表明,领域泛化算法在标签噪声下表现良好,但在真实数据集上未必优于经验风险最小化算法。
本文提出了多种改进的上下文强盗算法,包括基于广义线性模型的算法和Doubly-Robust Lasso Bandit算法,旨在提高计算效率和减少遗憾。这些新算法在对抗性环境中表现优越,提供了近似最优的遗憾上界,并为实际应用提供了理论指导。
本研究介绍了一种名为KATE的新型优化算法,它是AdaGrad算法的一个尺度不变适应版本。通过证明其在广义线性模型中具有尺度不变性,并利用数值实验比较KATE与Adam和AdaGrad算法在不同问题上的性能,结果表明KATE在各种情境中始终优于AdaGrad并与Adam的性能相当甚至超越。
完成下面两步后,将自动完成登录并继续当前操作。