本研究提出了过去令牌预测(PTP)作为辅助任务,以解决从演示中学习长上下文策略的挑战。该方法显著提升了时间建模能力和策略训练效率,使长上下文扩散策略的性能提高了3倍,训练速度加快超过10倍。
本研究提出了“寻找所有关键文本”(FACT)方法,旨在解决大语言模型在多事实检索中的信息遗失问题,显著提升了检索性能,并强调了改进长上下文策略的重要性。
完成下面两步后,将自动完成登录并继续当前操作。