本研究利用大型语言模型从电子健康记录中提取社会健康决定因素(SDoH),并评估合成临床文本的改进效果。经过微调的Flan-T5 XL模型在识别不良SDoH患者方面表现优异,识别率达93.8%。研究还提出了儿科社会历史标注语料库(PedSHAC),标注一致性为81.9 F1。通过软提示学习,GatorTronGPT模型在跨领域应用中提升了提取性能。
本研究利用大型语言模型从电子健康记录中提取社会健康决定因素(SDoH),并评估合成临床文本的改进效果。最佳模型为微调的Flan-T5 XL,识别不良SDoH患者的准确率高达93.8%。研究还提出了新的标注语料库PedSHAC,展示了基于LLM的提取器在SDoH提取中的潜力。
本文探讨了大型语言模型(LLM)在临床自然语言处理中的应用,特别是在电子健康记录中提取社会健康决定因素(SDoH)的能力。研究显示,经过微调的模型在识别不良SDoH患者方面的准确率达到93.8%。此外,GatorTronGPT模型在医学文本生成方面表现优异,能够与人类生成的文本相媲美,强调了LLM在提升临床决策能力和处理隐私问题方面的潜力。
该研究评估了GPT模型在电子健康记录中提取人口统计学、社会健康决定因素和家族史信息的性能。结果显示,GPT-3.5在人口统计学提取上表现良好,但在社会健康决定因素和家族史提取上表现较差。研究指出GPT模型的局限性,需要进一步改进。
完成下面两步后,将自动完成登录并继续当前操作。