本研究提出了一种基于图的全局优化框架,解决带有非凸正则化函数的统计模型参数估计问题。该方法通过构建强凸松弛,确保收敛到全局最优,并在稀疏线性回归中展示了有效性。
本文探讨了softmax注意力的几何局限性,提出用归一化替代softmax以增强自我注意力的鲁棒性。研究表明,多头注意力在上下文学习和线性回归任务中优于单头注意力,尤其在复杂数据分布下表现更佳。此外,分析了自注意力机制的隐式偏差及其与层标准化的关系,揭示了多头变压器在稀疏线性回归中的不同表现模式。
本文探讨了局部差分隐私(LDP)下的稀疏线性回归问题,提出了一种非交互式局部差分隐私(NLDP)算法,并提供了误差上界。研究比较了不同隐私模型在稀疏线性回归中的差异,并分析了高维度平均值估计及其隐私保护机制。
该文介绍了一种新的梯度估计器 SIMPLE,相对于 $k=1$ 时的 Gumbel 估计器表现出更低的偏差和方差,并在解释和稀疏线性回归方面取得了改进。同时,提供了一个计算 $k$- 子集分布的确切 ELBO 的算法,相对于 SOTA 获得了显著的更低损失。
完成下面两步后,将自动完成登录并继续当前操作。