小红花·文摘 - 小红花技术领袖俱乐部

超越Logits：语言建模中的三元民主崛起

超越Logits：语言建模中的三元民主崛起

DEV Community ·

本研究提出了一种粗到细的标记预测方法，解决自回归图像生成中的量化误差问题。实验结果显示，Inception分数平均提升59分，且采样速度更快。

Enhancing Autoregressive Image Generation through Coarse-to-Fine Label Prediction

BriefGPT - AI 论文速递 ·

本研究提出了一个理论框架，探讨大型语言模型在下一个标记预测任务中的长度泛化问题，发现每个预测标记依赖于固定数量的前置标记，并提出了“预测位置耦合”方法以提升模型的泛化能力。

The Role of Sparsity in Length Generalization of Transformers

BriefGPT - AI 论文速递 ·

今天的人工智能：上下文学习者的混合方法

今天的人工智能：上下文学习者的混合方法

DEV Community ·

通过27小时行走数据训练全尺寸仿人机器人，在旧金山自由行走。研究将仿人控制视为标记预测问题，通过传感器运动轨迹的自回归预测训练模型。结果表明，模型能在现实世界中泛化，并执行未见过的指令。研究为学习真实世界控制任务提供了前景广阔的道路。

大模型+机器人：人形运动作为下一个Token预测

极道 ·