扩散驱动:下一个令牌预测满序列扩散

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

该论文介绍了一种名为Diffusion Forcing的新训练范例,通过扩散模型去噪一组标记。该方法将下一个标记预测模型的优点与完全序列扩散模型的优势相结合,提供了额外的功能,并在决策和规划任务中提升性能。

🎯

关键要点

  • 该论文介绍了一种名为Diffusion Forcing的新训练范例。
  • Diffusion Forcing利用扩散模型以独立的逐标记噪声级别去噪一组标记。
  • 该方法应用于序列生成建模,通过训练因果型下一个标记预测模型生成未来标记。
  • 方法结合了下一个标记预测模型的优点和完全序列扩散模型的优势。
  • 提供额外功能,如生成连续标记序列和新的采样引导方案。
  • 在决策和规划任务中显著提升性能。
  • 证明了优化真实联合分布中抽取的所有子序列的似然的变分下界。
➡️

继续阅读