利用 James-Stein 估计器控制黑盒变分推断的方差
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
黑盒变分推断是使变分推断更“黑盒”的有前途的框架。我们提出了一种通过将随机梯度上升重新定位为多元估计问题来规范其参数更新的方法。该方法提供了更简单的代替和不需要微调的权衡。在基准数据集上的性能表明,与Rao-Blackwell化方法相比具有一致的表现或更好。
🎯
关键要点
-
黑盒变分推断是使变分推断更“黑盒”的有前途的框架。
-
基本版本存在不稳定性,导致无法收敛或需要调整更新步骤。
-
提出了一种通过将随机梯度上升重新定位为多元估计问题的方法来规范参数更新。
-
该方法在方差减小方面相对较弱,但提供了更简单的替代方案,且不需要微调。
-
基准数据集上的性能表明,与Rao-Blackwell化方法相比,模型拟合和收敛时间表现一致或更好。
🏷️
标签
➡️