建模健康记录的数据增强方法及其在氯吡格雷治疗失败检测中的应用
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本文提出了一种利用纵向结构化的电子健康记录(EHR)自动检测和预测氯吡格雷治疗失败的机器学习算法。通过将自然语言和结构化EHR进行类比,引入了自然语言处理(NLP)应用中的机器学习算法来构建处理失败检测和预测的模型。实验结果显示,基于Transformer的BERT模型在检测和预测任务中的性能优于词袋方法。
🎯
关键要点
-
提出了一种利用纵向结构化的电子健康记录(EHR)自动检测和预测氯吡格雷治疗失败的机器学习算法。
-
通过将自然语言和结构化EHR进行类比,引入了自然语言处理(NLP)中的机器学习算法。
-
从英国生物库生成了一个氯吡格雷处方患者队列,并注释了处理失败事件。
-
在502,527名患者中,1,824名患者被确定为处理失败病例。
-
模型整合了患者的诊断、处方和程序记录,构建了检测和预测任务。
-
实验结果显示,基于Transformer的BERT模型在检测和预测任务中性能优于词袋方法。
-
BERT在检测任务中可达到0.928的AUC,在预测任务中可达到0.729的AUC。
-
BERT在训练数据不足时仍显示出优势,利用大量未标记数据的预训练过程。
🏷️