小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
强大易用的机器学习库:助您轻松入门与进阶 | 开源日报 No.840

Meditron 是一款开源医疗语言模型,提供 Meditron-7B 和 Meditron-70B 版本,专注于医学推理,性能超越 Llama-2 和 GPT-3.5。采用 CRATE 架构优化稀疏率,支持 PyTorch 实验,并包含 AI 代码翻译工具和 scikit-learn 机器学习模块。

强大易用的机器学习库:助您轻松入门与进阶 | 开源日报 No.840

开源服务指南
开源服务指南 · 2026-01-04T07:35:29Z

夸克健康大模型成功通过12门主任医师考试,成为国内首个完成此挑战的大模型。该模型具备“慢思考能力”,通过高质量数据和强化学习提升医学推理能力,吸引了200万医学生和医生使用。

再次拔高上限!夸克健康大模型通过12门主任医师考试

量子位
量子位 · 2025-07-23T05:02:42Z

本研究提出了医学推理分割和检测(MedSD)新任务,旨在解决现有医学图像感知方法的局限性。通过引入多视角医学数据集(MLMR-SD)和模型MediSee,研究表明该方法能够有效处理隐含查询,且性能优于传统方法。

mediSee: Reasoning-based Pixel-level Perception in Medical Images

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z

本研究提出了MedAgentsBench基准,旨在评估复杂医学推理的不足,尤其是在多步骤临床推理和诊断形成方面。实验结果表明,最新的思维模型在这些任务中表现优异,而高级搜索代理方法具有较高的性价比,推动了医学问答领域的发展。

MedAgentsBench: Benchmarking Thinking Models and Agent Frameworks for Complex Medical Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z
慢思考助力医学大语言模型突破数据瓶颈:上海交大联合上海AI Lab推出MedS3系统

上海交通大学与复旦大学团队开发了新型医学推理系统MedS3,采用自我进化的慢思考范式,能够细粒度验证推理过程。该系统在医疗知识问答和诊断任务中表现优异,显著超越现有模型,解决了医疗数据匮乏的问题,提升了数据利用率和推理能力。

慢思考助力医学大语言模型突破数据瓶颈:上海交大联合上海AI Lab推出MedS3系统

机器之心
机器之心 · 2025-02-21T08:04:00Z
医疗AI的隐形危机:大语言模型过度自信,如何破解?

比利时研究团队开发了MetaMedQA评估基准,以测试大语言模型(LLMs)在医学推理中的表现,尤其是识别知识盲区的能力。研究表明,尽管LLMs在准确率上表现良好,但在处理不确定性时存在系统性缺陷,未来需改进评估标准和模型的自我认知能力。

医疗AI的隐形危机:大语言模型过度自信,如何破解?

机器之心
机器之心 · 2025-02-03T06:17:00Z
AI华佗?港中大、深圳大数据研究院提出医疗推理大模型HuatuoGPT-o1

香港中文大学与深圳市大数据研究院的研究人员开发了HuatuoGPT-o1,这是一种增强医学推理能力的大型语言模型。该模型通过40,000个可验证的医学问题进行训练,表现优于传统医学模型。研究表明,复杂推理和强化学习显著提升了医学问题的解决能力,具有广泛的应用前景。

AI华佗?港中大、深圳大数据研究院提出医疗推理大模型HuatuoGPT-o1

机器之心
机器之心 · 2025-01-07T06:51:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码