DeIDClinic:一种多层次的临床自由文本数据去识别化框架
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
研究探讨了如何在保护医疗数据隐私的同时,使用深度学习的命名实体识别去除医疗记录中的敏感信息。结果表明,BiLSTM-CRF 是最佳方法,字符嵌入和 CRF 在精度和召回率上表现良好,而单独使用 Transformer 效果较差。未来可通过结构化医疗文本提升效果。
🎯
关键要点
-
研究探讨如何在保护医疗数据隐私的前提下,使用深度学习的命名实体识别去除医疗记录中的敏感信息。
-
BiLSTM-CRF 被发现是最佳的编码/解码器组合方式。
-
字符嵌入和 CRF 在精度和召回率上表现良好。
-
单独使用 Transformer 效果较差。
-
未来研究可通过结构化医疗文本提升去识别效果。
🏷️
标签
➡️