麒麟医:多阶段知识注入的先进医疗大型语言模型
原文中文,约400字,阅读约需1分钟。发表于: 。将大型语言模型(LLMs)整合到医疗保健中存在潜力但也面临挑战。我们提出了一种多阶段训练方法,结合了专业域持续预训练(DCPT)、监督微调(SFT)和直接偏好优化(DPO),并引入一个包含医疗问答、纯文本、知识图谱和对话的 3Gb 中医数据集。通过我们的训练流程,医学 LLM(Qilin-Med)表现出显著的性能提升,突破了 Baichuan-7B 在 CMExam 上的准确率,并在...
该研究提出了一种多阶段训练方法,将大型语言模型整合到医疗保健中,通过专业域持续预训练、监督微调和直接偏好优化,并引入一个包含医疗问答、纯文本、知识图谱和对话的数据集。经过训练,医学LLM在医疗应用中表现出显著的性能提升,达到了较高的准确率和性能。