残余上下文扩散语言模型(RCD)通过回收被丢弃的令牌,提升了扩散大语言模型(dLLMs)的效率。RCD将这些令牌转化为上下文残差,注入下一步去噪中。该方法在多个基准测试中提高了5-10个百分点的准确率,特别是在AIME任务中,准确率几乎翻倍,去噪步骤减少4-5倍。
完成下面两步后,将自动完成登录并继续当前操作。