该论文介绍了一种名为Diffusion Forcing的新训练范例,通过扩散模型去噪一组标记。该方法将下一个标记预测模型的优点与完全序列扩散模型的优势相结合,提供了额外的功能,并在决策和规划任务中提升性能。
完成下面两步后,将自动完成登录并继续当前操作。