小红花·文摘

本研究介绍了Sequoia算法，用于加速大型语言模型的推理。通过动态规划算法找到最佳树结构，采样和验证方法实现鲁棒的推测性能，通过自动选择硬件平台的标记树大小和深度来优化硬件感知的树优化器。在A100上，解码速度提高了4.04倍、3.84倍和2.37倍，并在L40上将卸载速度提高了10.33倍。

Sequoia：可伸缩、稳健且硬件感知的推测解码

BriefGPT - AI 论文速递 ·

本文介绍了基于回报条件的监督学习（RCSL）的离策略学习技术如何在放松了的 Bellman 完备性条件下收敛，并提出了 MBRCSL 框架，通过学习的动力学模型和前向采样来实现轨迹拼接，避免了动态规划算法中的 Bellman 完备性需求。使用两层多层感知机作为函数逼近器时，该技术实现了与动态规划方法相媲美的性能。

无需贝尔曼完备性：基于模型的回归条件监督学习的轨迹拼接方法

BriefGPT - AI 论文速递 ·