随机环境下的预期流网络与两人零和游戏
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种基于能量的生成流网络算法(EB-GFN),通过随机构造数据策略来建模生成过程,并将昂贵的MCMC探索分摊开来。该算法可以近似执行大块Gibbs采样以在多个模式之间混合。
🎯
关键要点
- 提出了一种基于能量的生成流网络 (EB-GFN) 概率建模算法。
- 该算法通过随机构造数据策略来建模生成过程。
- 将昂贵的 MCMC 探索分摊在固定数量的操作中。
- 展示了 GFlowNet 如何近似执行大块 Gibbs 采样以在多个模式之间混合。
- 提出了一个框架,共同训练 GFlowNet 与能量函数。
- GFlowNet 学习从能量分布中采样,能量通过近似 MLE 目标进行学习。
- 展示了 EB-GFN 在各种概率建模任务中的有效性。
➡️