合成数据:能否信任统计估计器?
原文中文,约300字,阅读约需1分钟。发表于: 。在研究中,我们强调了推论效用的重要性,并提供了反对从合成数据(处理这些数据就好像它们是真实观察到的一样)进行天真推断的实证证据,我们认为即使估计是无偏的,阳性结果的率(类型 1 错误)将会不可接受地高,一个原因是低估了真实标准误差,它可能会随着更大样本量而逐渐增加,导致收敛较慢。这对于深度生成模型尤其是一个问题。在发布合成数据之前,开发针对这样的数据的统计推断工具至关重要。
研究者强调推论效用的重要性,并提供了反对使用合成数据进行天真推断的实证证据。他们认为即使估计是无偏的,阳性结果的率将会不可接受地高,一个原因是低估了真实标准误差。这对于深度生成模型尤其是一个问题。因此,在发布合成数据之前,开发针对这样的数据的统计推断工具至关重要。