小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了BanditSpec框架，解决了推测解码中前缀令牌配置固定的问题。通过将超参数选择视为多臂强盗问题，设计了两种算法，实验结果表明其在文本生成中优于现有方法，提高了语言模型的推理效率。

BanditSpec: Achieving Adaptive Speculative Decoding through Bandit Algorithms

BriefGPT - AI 论文速递 ·

本文研究虚拟功能部署问题，提出了一种基于多臂强盗理论的新算法。结果表明，该算法能快速学习最优部署策略，并在满足约束条件下，后悔值增长速率为$O( N M \\sqrt{T\ln T} )$，具有良好的实用性能和适度的计算复杂性。

Efficient Function Deployment in Virtual Networks: An Online Learning Approach

BriefGPT - AI 论文速递 ·