如何评估您的合成数据的真实性?给表格数据的深度生成模型设限
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文提出了一种深层生成模型(DGMs)的可识别性理论,并通过应用非线性独立成分分析的最新进展进行扩展。实验证明,拟合比较DGMs的规范化技术在未知潜变量数量时有助于可识别性。同时引入了一种改进多数据源处理的方法。
🎯
关键要点
- 深层生成模型(DGMs)是学习数据表示的多功能工具。
- 本文提出了一种比较DGMs的可识别性理论,并扩展了非线性独立成分分析的最新进展。
- 当混合函数是分段仿射函数时,这些模型在广义混合函数类中缺乏可识别性,但在特定情况下变得可识别。
- 探究了模型错误规范化的影响,并证明了拟合比较DGMs的规范化技术在未知潜变量数量时有助于可识别性。
- 引入了一种通过多目标优化改进多数据源处理的方法,并使用约束优化调整规范化超参数。
- 通过模拟数据和单细胞RNA测序数据集对理论和新方法进行了实证验证。
➡️