小红花·文摘

研究人员提出了一种新的评估框架，用于评估医学成像报告。他们利用语言模型评估结果构建数据集，并进行了知识蒸馏以训练较小的模型。该模型的评估能力与GPT-4相当，为医学成像报告生成提供了一种易于使用和高效的评估方法。该研究有助于开发更具临床相关性的模型，并将进一步开源和提供可访问性。

BURExtract-Llama：用于乳腺超声报告中临床概念提取的语言模型

BriefGPT - AI 论文速递 ·

研究提出了一种新的评估框架，使用大型语言模型评估医学成像报告。通过与医生评估结果对比，提出了一种性能接近GPT-4的度量标准。利用语言模型评估结果构建数据集，进行知识蒸馏，训练出较小的模型，其评估能力与GPT-4相当。该方法为医学成像报告生成提供了易于使用和高效的评估方法，促进了更具临床相关性的模型的开发。该模型将进一步开源和提供可访问性。

面向三维脑部 CT 报告生成的多模态大型语言模型的整体框架

BriefGPT - AI 论文速递 ·

研究提出了一种新的评估框架，使用大型语言模型对医学成像报告进行评估。通过与放射科医生评估结果对比，提出了一种性能接近GPT-4的度量标准。利用语言模型评估结果构建数据集，进行了知识蒸馏以训练较小的模型，该模型的评估能力与GPT-4相当。该方法提供了一种易于使用和高效的评估方法，促进了更具临床相关性的模型的开发。

通过改进多模态大型语言模型应用临床指南进行前列腺癌 PI-RADS 评分

BriefGPT - AI 论文速递 ·

研究提出了一种新的评估框架，使用大型语言模型评估医学成像报告。通过与放射科医生评估结果对比，提出了一种性能接近GPT-4的度量标准。利用语言模型评估结果构建数据集，进行了知识蒸馏以训练较小的模型，该模型的评估能力与GPT-4相当。该方法提供了一种易于使用和高效的评估方法，促进了更具临床相关性的模型的开发。

提交放射学报告给 ChatGPT 的法律和伦理考虑

BriefGPT - AI 论文速递 ·