建模健康记录的数据增强方法及其在氯吡格雷治疗失败检测中的应用

原文约500字,阅读约需2分钟。发表于:

我们提出了一种新颖的数据增广方法来解决在使用自然语言处理算法对患者的电子健康记录中建模纵向模式时面临的数据稀缺挑战。该方法通过重新排列访问中医疗记录的顺序来生成增广数据,在顺序不明显的情况下,如果有的话。将该方法应用于氯吡格雷治疗失败检测任务中,在预训练过程中使用增广技术使得 ROC-AUC 指标(从 0.908—— 没有增广到 0.961—— 使用增广)提升了 5.3%。同时,通过增广技术在有限标记训练数据的情况下,还能够改善精细调整过程中的性能。

本文提出了一种利用纵向结构化的电子健康记录(EHR)自动检测和预测氯吡格雷治疗失败的机器学习算法。通过将自然语言和结构化EHR进行类比,引入了自然语言处理(NLP)应用中的机器学习算法来构建处理失败检测和预测的模型。实验结果显示,基于Transformer的BERT模型在检测和预测任务中的性能优于词袋方法。

相关推荐 去reddit讨论