为葡萄牙医疗领域适应大型语言模型:微调与模型评估研究
发表于: 。本研究针对大型语言模型(LLMs)在葡萄牙医疗领域的应用,评估其作为医疗助手的表现,旨在开发一个可靠的虚拟助手。研究通过PEFT-QLoRA方法微调ChatBode-7B模型,发现InternLM2模型在准确性和安全性等指标上表现最佳,同时也揭示了模型知识遗忘现象及评估协议不稳的挑战,为未来的多语言医疗模型评估和数据质量提升提供了方向。
本研究针对大型语言模型(LLMs)在葡萄牙医疗领域的应用,评估其作为医疗助手的表现,旨在开发一个可靠的虚拟助手。研究通过PEFT-QLoRA方法微调ChatBode-7B模型,发现InternLM2模型在准确性和安全性等指标上表现最佳,同时也揭示了模型知识遗忘现象及评估协议不稳的挑战,为未来的多语言医疗模型评估和数据质量提升提供了方向。