Generating Synthetic Free-text Medical Records with Low Re-identification Risk using Masked Language Modeling
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种利用掩码语言模型生成合成自由文本医学记录的方法,旨在平衡隐私保护与信息多样性。该系统能够保留关键医疗信息,降低重识别风险,生成高质量、灵活的合成数据,适用于隐私保护的数据研究和应用。
🎯
关键要点
-
本研究提出了一种利用掩码语言模型生成合成自由文本医学记录的方法。
-
该系统旨在平衡隐私保护与信息多样性,保留关键医疗信息。
-
系统能够显著降低重识别风险,生成高质量、灵活的合成数据。
-
合成数据适用于隐私保护的数据研究和应用。
➡️