BURExtract-Llama:用于乳腺超声报告中临床概念提取的语言模型
原文中文,约200字,阅读约需1分钟。发表于: 。本研究解决了乳腺超声报告中提取关键信息的挑战,针对报告格式不一致和语言多样性的问题,开发了一种内部大型语言模型(LLM)。通过使用GPT-4创建标签数据集并对Llama3-8B模型进行微调,我们的模型在医生注释的报告上达到84.6%的平均F1分数,表明其性能与GPT-4相当,同时提供了成本节约和数据隐私的优势。
研究人员提出了一种新的评估框架,用于评估医学成像报告。他们利用语言模型评估结果构建数据集,并进行了知识蒸馏以训练较小的模型。该模型的评估能力与GPT-4相当,为医学成像报告生成提供了一种易于使用和高效的评估方法。该研究有助于开发更具临床相关性的模型,并将进一步开源和提供可访问性。