MixEHR-Nest:通过分层引导主题建模识别电子健康记录中的亚表型

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

研究利用大型语言模型从电子健康记录中提取社会健康决定因素(SDoH),并探讨合成临床文本的改进作用。微调的Flan-T5 XL和XXL模型表现最佳,优于ChatGPT系列,显示出较少的算法偏见。模型识别出93.8%存在不良SDoH的患者,而ICD-10代码仅覆盖2.0%。该方法有效提取SDoH信息,帮助识别需社会支持的患者。

🎯

关键要点

  • 研究利用大型语言模型从电子健康记录中提取社会健康决定因素(SDoH)。
  • 微调的Flan-T5 XL和XXL模型表现最佳,宏F1值分别为0.71和0.70。
  • 这些模型在零样本和少样本性能上优于ChatGPT系列,显示出较少的算法偏见。
  • 模型识别出93.8%存在不良SDoH的患者,而ICD-10代码仅覆盖2.0%。
  • 该方法有效提取SDoH信息,帮助识别需社会支持的患者。
➡️

继续阅读