Apple Machine Learning Research ·

你的语言模型预知未来：揭示其多标记预测潜力

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

本文提出了一种新框架，利用自回归语言模型提升生成速度和并行性。关键创新包括掩码输入形式、门控LoRA结构、轻量可学习采样模块、辅助训练损失和投机生成策略。该方法在预训练模型上进行监督微调，生成速度提高近5倍，且质量无损。

🎯

🔎

自回归语言模型在生成过程中受到顺序生成的限制，导致推理速度和并行性不足。尤其是在生成后期，文本的方向和语义相对确定时，传统模型的效率显得尤为低下。了解这一点有助于读者认识到新框架的必要性和创新性。

本文提出的新框架通过掩码输入形式和门控LoRA结构等创新，显著提升了生成速度和质量。特别是轻量可学习采样模块和辅助训练损失的引入，使得多标记预测成为可能。这些技术的结合为未来的语言模型研究提供了新的思路。

该方法在预训练模型上进行监督微调，生成速度提高近5倍，且质量无损。这一成果在代码生成和数学任务中表现尤为突出，显示出其在实际应用中的巨大潜力，尤其是在需要快速生成高质量文本的场景中。

❓

自回归语言模型的生成速度受到其顺序生成的限制，导致生成一个标记时的延迟。

关键创新包括掩码输入形式、门控LoRA结构、轻量可学习采样模块、辅助训练损失和投机生成策略。

新框架利用自回归语言模型对未来标记的知识，通过掩码输入形式实现多个未来标记的联合预测。

该方法在生成速度上提高了近5倍，且质量无损。

通过在预训练模型上进行监督微调，可以显著提高生成速度和任务表现。

投机生成策略可以在保持高保真的同时，扩展未来标记的生成速度。

🏷️