预训练和微调生成流网络

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种基于能量的生成流网络概率建模算法,通过随机构造数据策略来建模生成过程,并将昂贵的MCMC探索分摊开来。同时,提出了一个框架,共同训练GFlowNet与能量函数,使其在各种概率建模任务中表现出有效性。

🎯

关键要点

  • 提出了一种基于能量的生成流网络 (EB-GFN) 概率建模算法。
  • 该算法通过随机构造数据策略来建模生成过程。
  • 将昂贵的 MCMC 探索分摊到从 GFlowNet 中采样的固定数量的操作中。
  • 展示了 GFlowNet 如何近似执行大块 Gibbs 采样以在多个模式之间混合。
  • 提出了一个框架,共同训练 GFlowNet 与能量函数。
  • GFlowNet 学习从能量分布中采样,能量通过近似 MLE 目标进行学习。
  • 展示了 EB-GFN 在各种概率建模任务中的有效性。
➡️

继续阅读