R-ParVI:基于粒子的变分推断方法通过奖励的视角

📝

内容提要

本研究解决了在部分已知密度下进行高效采样的问题,提出了一种新的粒子变分推断方法R-ParVI。该方法采用奖励机制引导粒子运动,通过模拟粒子与环境的交互,实现了快速、灵活且可扩展的采样和推断,特别适用于贝叶斯推断和生成建模中的概率模型。

➡️

继续阅读