Alpha-VI DeepONet: 一种增强深度神经网络的先验鲁棒性变分贝叶斯方法与不确定性量化
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
该文章介绍了一种新的深度算子网络框架,使用Rényi的α-散度进行广义变分推断,学习复杂算子并量化不确定性。该框架通过修改变分目标函数,在减小均方误差和改善测试集上的负对数似然方面取得了更好的结果。在预测准确性和不确定性量化方面,该框架超越了确定性和基于标准KLD的变分推断DeepONet。通过调整超参数α,可以优化特定问题的性能。该方法在重力摆、对流-扩散和扩散-反应系统等力学问题上展示了潜力。
🎯
关键要点
- 介绍了一种新颖的深度算子网络框架,使用Rényi的α-散度进行广义变分推断。
- 该框架学习复杂算子并量化不确定性,使用贝叶斯神经网络作为构建模块。
- 通过修改变分目标函数,框架在减小均方误差和改善测试集负对数似然方面取得了更好结果。
- 在预测准确性和不确定性量化方面,框架超越了确定性和基于标准KLD的变分推断DeepONet。
- 通过调整超参数α,可以优化特定问题的性能。
- 该方法在重力摆、对流-扩散和扩散-反应系统等力学问题上展示了潜力。
- 发现α-变分推断DeepONet在数据驱动算子学习和工程科学领域的潜力。
➡️