小红花·文摘 - 小红花技术领袖俱乐部

强大易用的机器学习库：助您轻松入门与进阶 | 开源日报 No.840

强大易用的机器学习库：助您轻松入门与进阶 | 开源日报 No.840

开源服务指南 ·

夸克健康大模型成功通过12门主任医师考试，成为国内首个完成此挑战的大模型。该模型具备“慢思考能力”，通过高质量数据和强化学习提升医学推理能力，吸引了200万医学生和医生使用。

再次拔高上限！夸克健康大模型通过12门主任医师考试

量子位 ·

本研究提出了医学推理分割和检测（MedSD）新任务，旨在解决现有医学图像感知方法的局限性。通过引入多视角医学数据集（MLMR-SD）和模型MediSee，研究表明该方法能够有效处理隐含查询，且性能优于传统方法。

mediSee: Reasoning-based Pixel-level Perception in Medical Images

BriefGPT - AI 论文速递 ·

本研究提出了MedAgentsBench基准，旨在评估复杂医学推理的不足，尤其是在多步骤临床推理和诊断形成方面。实验结果表明，最新的思维模型在这些任务中表现优异，而高级搜索代理方法具有较高的性价比，推动了医学问答领域的发展。

MedAgentsBench: Benchmarking Thinking Models and Agent Frameworks for Complex Medical Reasoning

BriefGPT - AI 论文速递 ·

本研究提出了Med-RLVR，利用医学多项选择题数据通过强化学习探讨医学推理的涌现。结果表明，Med-RLVR在医学问题回答上与传统方法相当，但在跨分布泛化能力上提升了8个百分点，显示出其在知识密集型领域的潜力。

Med-RLVR: Emerging Medical Reasoning from a 3B Base Model via Reinforcement Learning

BriefGPT - AI 论文速递 ·

慢思考助力医学大语言模型突破数据瓶颈：上海交大联合上海AI Lab推出MedS3系统

慢思考助力医学大语言模型突破数据瓶颈：上海交大联合上海AI Lab推出MedS3系统

机器之心 ·

医疗AI的隐形危机：大语言模型过度自信，如何破解？

医疗AI的隐形危机：大语言模型过度自信，如何破解？

机器之心 ·

AI华佗？港中大、深圳大数据研究院提出医疗推理大模型HuatuoGPT-o1

AI华佗？港中大、深圳大数据研究院提出医疗推理大模型HuatuoGPT-o1

机器之心 ·

Gemini系列多模态模型具备出色的图像、音频、视频和文本理解能力，分为Ultra、Pro和Nano三种规模。Gemini Ultra在医学推理和常识推理方面表现优异，但在诊断准确性上仍需改进，为多模态应用提供了新的可能性。

Gemma：基于 Gemini 研究和技术的开放模型

BriefGPT - AI 论文速递 ·