利用合成图像协变量和纵向数据评估预测模型的框架

本研究针对医疗研究中的隐私问题，提出了一种合成患者数据的框架，能够生成复杂的协变量与纵向观察对。该框架通过在潜在空间中引入受控关联，支持开发预测模型，并提供公开的基准数据集，以促进医疗研究。研究结果表明，该框架在不同受控关联水平下生成的合成数据，具有良好的预测准确性，展示了其在医疗领域的应用潜力。

医学图像生成的潜在扩散模型在隐私保护数据共享中应用广泛，但存在患者数据记忆化问题。研究显示，CT、MRI和X射线数据集中分别有41.7%、19.6%和32.6%的记忆化现象。增加训练数据和数据增强可减少记忆化，而过度训练则会加剧。建议在共享数据前评估合成数据的记忆化影响。

医学图像数据共享数据记忆化潜在扩散模型隐私保护