本文提出了一种新的令牌清理方法,旨在改善大型语言模型(LLM)监督微调中的数据质量问题。研究表明,分析模型更新对令牌的影响可以显著提升模型在下游任务中的表现。
完成下面两步后,将自动完成登录并继续当前操作。