Meditron 是一款开源医疗语言模型,提供 Meditron-7B 和 Meditron-70B 版本,专注于医学推理,性能超越 Llama-2 和 GPT-3.5。采用 CRATE 架构优化稀疏率,支持 PyTorch 实验,并包含 AI 代码翻译工具和 scikit-learn 机器学习模块。
夸克健康大模型成功通过12门主任医师考试,成为国内首个完成此挑战的大模型。该模型具备“慢思考能力”,通过高质量数据和强化学习提升医学推理能力,吸引了200万医学生和医生使用。
本研究提出了医学推理分割和检测(MedSD)新任务,旨在解决现有医学图像感知方法的局限性。通过引入多视角医学数据集(MLMR-SD)和模型MediSee,研究表明该方法能够有效处理隐含查询,且性能优于传统方法。
本研究提出了MedAgentsBench基准,旨在评估复杂医学推理的不足,尤其是在多步骤临床推理和诊断形成方面。实验结果表明,最新的思维模型在这些任务中表现优异,而高级搜索代理方法具有较高的性价比,推动了医学问答领域的发展。
上海交通大学与复旦大学团队开发了新型医学推理系统MedS3,采用自我进化的慢思考范式,能够细粒度验证推理过程。该系统在医疗知识问答和诊断任务中表现优异,显著超越现有模型,解决了医疗数据匮乏的问题,提升了数据利用率和推理能力。
比利时研究团队开发了MetaMedQA评估基准,以测试大语言模型(LLMs)在医学推理中的表现,尤其是识别知识盲区的能力。研究表明,尽管LLMs在准确率上表现良好,但在处理不确定性时存在系统性缺陷,未来需改进评估标准和模型的自我认知能力。
香港中文大学与深圳市大数据研究院的研究人员开发了HuatuoGPT-o1,这是一种增强医学推理能力的大型语言模型。该模型通过40,000个可验证的医学问题进行训练,表现优于传统医学模型。研究表明,复杂推理和强化学习显著提升了医学问题的解决能力,具有广泛的应用前景。
完成下面两步后,将自动完成登录并继续当前操作。