量子位 ·

AI医生终于有了硬标尺！全球首个专病循证评测框架GAPS发布，蚂蚁联合北大王俊院士团队出品

💡 原文中文，约4400字，阅读约需11分钟。

📝

内容提要

蚂蚁健康与北大王俊院士团队发布全球首个专病循证评测框架GAPS，专注于肺癌，包含92个问题和1691个临床要点，旨在提升医疗AI的评测深度与可靠性。GAPS通过四个维度评估AI的临床能力，克服现有评测的局限，推动医疗AI向临床应用转型。

🎯

关键要点

蚂蚁健康与北大王俊院士团队发布全球首个专病循证评测框架GAPS，专注于肺癌。
GAPS包含92个问题和1691个临床要点，旨在提升医疗AI的评测深度与可靠性。
GAPS通过四个维度评估AI的临床能力，克服现有评测的局限。
院士团队主导临床标准构建，确保评测指标扎根真实临床实践。
GAPS解决了医疗AI评测仅关注准确率的局限，实现系统性、自动化评估。
GAPS的评测框架具备专家级可靠性，能够量化、复现和进化AI医疗能力。
研究显示，当前主流医疗大模型在应对复杂临床场景时表现脆弱。
GAPS标志着医疗AI评测标准的转移，从考试分数向临床胜任力的范式转变。

🏷️

继续阅读

2026年你应该尝试的6个最佳AI代理记忆框架
Bala Priya C是一位来自印度的开发者和技术作家，专注于数学、编程、数据科学和内容创作。她的兴趣包括DevOps、数据科学和自然语言处理，热爱阅读...
“最美PM”宋紫薇获红杉蚂蚁投资，创业方向略有调整，转向AI护肤
宋紫薇创办的AI护肤公司薇光点亮获得红杉和蚂蚁等投资，融资金额未公开。公司调整方向，专注于AI护肤，推出AI智能化妆镜，以满足年轻消费者需求。宋紫薇曾在华...
AI 不只是聊天：小龙虾背后的范式变化
小龙虾（OpenClaw）展示了三种AI应用方式：聊天AI、自动化工具和AI代理。聊天AI用于回答问题，自动化工具处理流程，而小龙虾能够自主规划任务。尽管...
AI客服越智能越坑人？坑了商家、坑客户，咋办？
AI客服给商家和顾客带来了困扰。商家面临客户诱导生成折扣码的问题，顾客则因无法解决问题而感到沮丧。AI客服的设计主要是为了节省成本，未必能有效解决实际问题...
派早报：达摩院发布脂肪肝筛查 AI 模型 MAOSS 等
阿里巴巴达摩院与多家医院合作研发的脂肪肝筛查AI模型MAOSS，能够通过CT影像和血清指标精准筛查肝脂肪分期，将高风险患者的检出率提升至52.4%。该研究...
Apple Studio Display XDR 评测：专业级显示器，价格不菲
该显示器提供两个预设模式：Apple XDR Display（P3-2000 nits）和Apple XDR Display（P3 + Adobe RGB...

AI医生终于有了硬标尺！全球首个专病循证评测框架GAPS发布，蚂蚁联合北大王俊院士团队出品

内容提要

关键要点

标签

继续阅读