AE-GPT: 使用大型语言模型从监测报告中提取不良事件 - 以流感疫苗不良事件为案例
利用 1990 年至 2016 年之间的 Vaccine Adverse Event Reporting System (VAERS) 数据,本研究重点评估了大型语言模型(LLMs)在不良事件(AEs)提取方面的能力,其中包括 GPT-2,GPT-3 变体,GPT-4 和 Llama 2 等多种流行 LLMs。其中,经过微调的 GPT 3.5 模型(AE-GPT)在严格匹配方面取得了...
本研究评估了多种大型语言模型在不良事件提取方面的能力,其中经过微调的GPT 3.5模型在严格匹配方面取得了0.704的平均微F1分数,松弛匹配方面为0.816。这表明LLMs在处理医疗数据方面具有潜力,并可能推广到其他AE提取任务。