小红花·文摘

肯·汤普森回忆Unix的喧闹与破解起源

The New Stack ·

本研究针对联邦学习中高计算和通信需求对资源有限设备的挑战，提出了一种新颖的联邦鲁棒剪枝框架（FedRTS）。该方法通过基于汤普森采样的调整机制，利用稳定和前瞻性的信息作出决策，从而提高鲁棒性和性能。实验结果表明，FedRTS在计算机视觉和自然语言处理任务上表现出色，同时降低了通信成本，特别是在数据分布异构和部分客户端参与的场景中。

联邦鲁棒剪枝：基于组合汤普森采样的方法

BriefGPT - AI 论文速递 ·

纽约警察局正在追踪一辆被UnitedHealthcare首席执行官凶手使用的Citi Bike

The Verge ·

本研究提出了一种高效的高斯过程汤普森采样优化策略，通过一维全局根查找识别局部最优点，并利用可微分解耦表示优化后验样本，提升高维全局优化能力，增强贝叶斯优化表现。

通过根查找的高斯过程汤普森采样

BriefGPT - AI 论文速递 ·

我们提出了一种基于模型的强化学习算法，使用非线性常微分方程描述连续时间动力学。通过校准的概率模型捕捉不确定性，并采用乐观原则进行探索。分析强调了测量选择策略（MSS）在连续时间下的重要性，尤其是在决定何时观察系统时。使用高斯过程建模时，后悔界限为次线性。我们还提出了一种自适应的MSS，能够在更少样本下达到次线性后悔，展示了其在连续时间建模中的优势。

通过乐观汤普森采样的高效模型基础强化学习

BriefGPT - AI 论文速递 ·

本研究提出了改进的Meta-TSLB算法，解决了高斯赌博机分析的局限性问题，展示了其适应未见实例的能力，具有重要的应用潜力。

线性赌博机的改进元汤普森采样及其贝叶斯遗憾分析

BriefGPT - AI 论文速递 ·

本文研究了基于Thompson Sampling的有界奖励随机赌博算法，并提出了两种参数化的算法。通过导出更实用的界限，解决了现有问题。这两种算法都能实现较低的后悔界限。

通过信息松弛改进预算多臂赌博机中的汤普森采样

BriefGPT - AI 论文速递 ·

在大型语言模型中，我们提出了一种新的方法，即具有无损加速的早期退出推理（EESD），通过在前 N 层后引入早期退出结构，利用语言模型的一部分生成初步令牌，并通过自蒸馏方法提高初步令牌的质量。我们还引入了一种新的采样机制，利用汤普森采样调节生成过程，自动确定每一轮的初步令牌数量。实验结果表明，与先前的方法相比，我们的方法在解码令牌时具有明显的加速效果。

通过提前退出进行投机解码以加速 LLM 推断，并采用汤普森抽样控制机制

BriefGPT - AI 论文速递 ·

通过建立马尔可夫决策过程模型，研究了汤普森采样算法的渐近行为。提出了一种新的指标，期望剩余遗憾，用于测量当前时期后的最优奖励的遗憾。证明了汤普森采样算法的期望剩余遗憾上界收敛于0。给出了后验采样误差收敛于0的条件，并引入了期望剩余遗憾的概率版本。这个学习概念在更广泛的情况下非常有用。

无限时间段折现决策过程的汤普森抽样

BriefGPT - AI 论文速递 ·

本研究提出了一种基于在线随机梯度下降的广义线性赌博机算法，能够在探索与利用之间取得平衡，在合成和实际数据集上始终优于现有算法。总时间复杂度为T和d的线性比例，其中T是总轮次数，d是特征数量，并实现了O（T）的遗憾，其中T是回合数。

上下文决斗赌徒的良好感知汤普森抽样

BriefGPT - AI 论文速递 ·

改良的 Thompson 抽样方法（TS）在贝叶斯优化（BO）中解决了利用 - 探索困境问题，在通过随机生成和最大化高斯过程（GP）后验样本路径来优先进行探索的同时，引入了 epsilon-greedy 策略来管理其利用，该策略随机在两种极端之间切换，从而平衡了两者的需求，并通过实验证明了该方法的有效性。

ε- 贪婪汤普森采样用于贝叶斯优化

BriefGPT - AI 论文速递 ·

本文对应用于凸体上的对数凸概率分布的Langevin Monte Carlo采样算法进行了理论分析，建立了收敛界限和算法复杂度证明，并进行了数值实验比较。

加速近似汤普森抽样与欠阻尼 Langevin 蒙特卡洛

BriefGPT - AI 论文速递 ·

通过将四种常见的离线计数数据模型（泊松、负二项、零膨胀泊松和零膨胀负二项回归）与汤普森抽样（Thompson sampling）结合起来，本研究提出了一种新的算法来改善 mHealth 系统用户参与度，并在真实数据和模拟数据上取得了好的结果。

零膨胀计数结果的汤普森抽样方法及其在饮酒减量移动健康研究中的应用

BriefGPT - AI 论文速递 ·

本研究提出了基于Thompson抽样的并行贝叶斯优化方法，称为STS-PBO，用于解决时间敏感的黑盒优化问题。该方法引入了速率失真理论构建平衡学习所需信息量和次优性的损失函数，并采用Blahut-Arimoto算法计算目标解。实验证明，STS-PBO方法在同步和异步设置中均优于串行方法和传统Thompson抽样的并行贝叶斯优化方法。

并行贝叶斯优化：基于满足性汤普森采样的时间敏感黑盒优化

BriefGPT - AI 论文速递 ·

本文介绍了 Thompson sampling 方法（MP-TS）及其改进版本，证明其具有最优后悔上界。

使用分数后验信息的汤普森抽样泛化遗憾分析

BriefGPT - AI 论文速递 ·