麒麟医:多阶段知识注入的先进医疗大型语言模型
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该研究提出了一种多阶段训练方法,将大型语言模型整合到医疗保健中,通过专业域持续预训练、监督微调和直接偏好优化,并引入一个包含医疗问答、纯文本、知识图谱和对话的数据集。经过训练,医学LLM在医疗应用中表现出显著的性能提升,达到了较高的准确率和性能。
🎯
关键要点
- 该研究提出了一种多阶段训练方法,将大型语言模型整合到医疗保健中。
- 方法包括专业域持续预训练、监督微调和直接偏好优化。
- 引入了一个包含医疗问答、纯文本、知识图谱和对话的3Gb中医数据集。
- 经过训练,医学LLM(Qilin-Med)在医疗应用中表现出显著的性能提升。
- Qilin-Med在CMExam上的准确率突破了Baichuan-7B,并在Huatuo-26M测试集上超过了SFT的性能。
- 在BLEU-1和ROUGE1指标上分别达到了16.66和27.44,显示出训练方法的优势。
➡️