本研究利用1990至2016年的VAERS数据,评估了大型语言模型(LLMs)在不良事件提取中的能力。经过微调的GPT-3.5模型(AE-GPT)在严格匹配和松弛匹配中表现优异,显示出LLMs在医疗数据处理中的潜力。研究还探讨了多任务训练和自我监督学习对模型性能的提升,强调了LLMs在医学知识提取中的应用前景。
本研究评估了多种大型语言模型在不良事件提取方面的能力,其中经过微调的GPT 3.5模型在严格匹配方面取得了0.704的平均微F1分数,松弛匹配方面为0.816。这表明LLMs在处理医疗数据方面具有潜力,并可能推广到其他AE提取任务。
完成下面两步后,将自动完成登录并继续当前操作。