利用合成图像协变量和纵向数据评估预测模型的框架
原文中文,约500字,阅读约需2分钟。发表于: 。本研究针对医疗研究中的隐私问题,提出了一种合成患者数据的框架,能够生成复杂的协变量与纵向观察对。该框架通过在潜在空间中引入受控关联,支持开发预测模型,并提供公开的基准数据集,以促进医疗研究。研究结果表明,该框架在不同受控关联水平下生成的合成数据,具有良好的预测准确性,展示了其在医疗领域的应用潜力。
医学图像生成的潜在扩散模型在隐私保护数据共享中应用广泛,但存在患者数据记忆化问题。研究显示,CT、MRI和X射线数据集中分别有41.7%、19.6%和32.6%的记忆化现象。增加训练数据和数据增强可减少记忆化,而过度训练则会加剧。建议在共享数据前评估合成数据的记忆化影响。