本研究分析了中国医学大型语言模型在准确性、安全性和伦理一致性方面的不足,提出了细致的错误分类法,并评估了前10个模型在MedBench上的表现。研究还提出了四级优化策略,以提升医学LLMs的临床应用价值和安全性。
本研究提出医学语言模型Citrus,旨在解决医疗行业中疾病推理的专业知识获取问题。Citrus通过训练合成数据,提高医疗决策支持系统的准确性和效率,并开放医疗诊断对话数据集以促进后续研究。
本研究提出了一种新型小型医学语言模型 extit{mone},有效解决了现有模型在临床应用中的数据效率低和实用性差的问题。通过奖励模型, extit{mone}在多个评估数据集上表现优于之前的开源模型,提升约13个百分点,显示出其在医学自然语言处理中的潜力。
完成下面两步后,将自动完成登录并继续当前操作。