随机环境下的预期流网络与两人零和游戏

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种基于能量的生成流网络算法(EB-GFN),通过随机构造数据策略来建模生成过程,并将昂贵的MCMC探索分摊开来。该算法可以近似执行大块Gibbs采样以在多个模式之间混合。

🎯

关键要点

  • 提出了一种基于能量的生成流网络 (EB-GFN) 概率建模算法。
  • 该算法通过随机构造数据策略来建模生成过程。
  • 将昂贵的 MCMC 探索分摊在固定数量的操作中。
  • 展示了 GFlowNet 如何近似执行大块 Gibbs 采样以在多个模式之间混合。
  • 提出了一个框架,共同训练 GFlowNet 与能量函数。
  • GFlowNet 学习从能量分布中采样,能量通过近似 MLE 目标进行学习。
  • 展示了 EB-GFN 在各种概率建模任务中的有效性。
➡️

继续阅读