本研究评估了多种大型语言模型在不良事件提取方面的能力,其中经过微调的GPT 3.5模型在严格匹配方面取得了0.704的平均微F1分数,松弛匹配方面为0.816。这表明LLMs在处理医疗数据方面具有潜力,并可能推广到其他AE提取任务。
完成下面两步后,将自动完成登录并继续当前操作。