Token Mixture: Combining Latent and Text Tokens to Improve Language Model Inference
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究通过引入潜在离散令牌的混合表示方法,解决了大语言模型推理中的输入冗长问题,显著提升了逻辑和数学推理任务的模型性能。
🎯
关键要点
- 本研究解决了大语言模型推理中的输入冗长问题。
- 引入了潜在离散令牌的混合表示方法。
- 显著减少了推理过程的长度。
- 新的混合数据训练方式提升了逻辑和数学推理任务的模型性能和适应能力。
➡️