TCM-FTP:中药方剂预测的大型语言模型微调

💡 原文中文,约1800字,阅读约需5分钟。
📝

内容提要

本文提出了一种针对中医领域的自适应方法,通过预训练和微调大型语言模型(如TCM-GPT-7B),显著提高了中医任务的准确性。研究引入多个中医数据集,评估不同模型的性能,强调了人工智能在中医诊疗中的潜力与挑战。

🎯

关键要点

  • 提出了一种针对中医领域的自适应方法,通过领域特定语料库对模型进行预训练和微调,提高中医任务的准确性。
  • TCM-GPT-7B 在两个中医任务上表现最佳,准确性分别提高了 17% 和 12%。
  • 研究引入了一个包含医疗问答、纯文本、知识图谱和对话的 3Gb 中医数据集,显著提升了医学 LLM 的性能。
  • 通过评估不同领域通用语言模型和医学领域特定语言模型,分析了它们在中医问答任务中的鲁棒性及不足。
  • TCM-Bench 提出了 TCMScore 作为评估 TCM 问题回答质量的指标,综合分析了大型语言模型在 TCM 领域的能力和局限性。
  • 研究表明,人工智能技术可以信息化和智能化传统中医诊疗系统,但现有数据集不足以支持进一步发展。
  • 介绍了首个涵盖 148 种证候的大规模数据集(TCM-SD),并提出了领域特定的预训练语言模型(ZY-BERT),揭示了证候辨析的挑战。
  • 开发了中医领域大型模型 Qibo,并创建了评估工具 Qibo-benchmark,为中医智能助手的研究和应用提供指导。

延伸问答

TCM-GPT-7B模型的准确性提升了多少?

TCM-GPT-7B在两个中医任务上的准确性分别提高了17%和12%。

TCM-SD数据集的特点是什么?

TCM-SD是首个涵盖148种证候的大规模数据集,旨在支持中医证候辨析的研究。

如何评估中医领域大型语言模型的性能?

TCM-Bench提出了TCMScore作为评估中医问题回答质量的指标,综合分析模型的能力和局限性。

人工智能在中医诊疗中面临哪些挑战?

人工智能在中医诊疗中面临数据集不足以支持进一步发展的挑战。

TCM-FTP方法的主要步骤是什么?

TCM-FTP方法结合了专业域持续预训练、监督微调和直接偏好优化等多阶段训练步骤。

Qibo模型的开发目的是什么?

Qibo模型旨在为中医领域提供专业知识,支持中医智能助手的研究和应用。

➡️

继续阅读