本研究评估了八个大型语言模型在六个数据集和四个摘要任务上的表现,发现大型语言模型在临床文本摘要任务中优于人工摘要。研究还分析了自然语言处理指标与医生评分的相关性,以提高对指标与医生喜好的理解。结果表明将大型语言模型整合到临床工作流程中可以减轻文档负担,使医生能够更多关注个性化患者护理和其他医学环节。
本研究使用八个大型语言模型在六个数据集和四个不同的摘要任务上进行评估,结果显示最佳适应的大型语言模型在完整性和正确性方面优于人工摘要。研究还分析了自然语言处理指标与医生评分的相关性,以提高对指标与医生喜好的理解。研究表明大型语言模型在临床文本摘要任务中超越人工专家,减轻文档负担,使医生能够更多关注个性化患者护理和其他医学环节。
完成下面两步后,将自动完成登录并继续当前操作。