量子位 ·

蚂蚁专用模型超越o3！仅用2K训练样本刷新医疗AI榜单纪录

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

蚂蚁集团发布的MedResearcher-R1模型仅用2100条训练样本，在医疗AI测试中超越通用大模型，展示了专业模型在医疗领域的优势。该模型通过创新训练方法和专用工具，提高了医疗研究的准确性和效率，彰显小规模模型的潜力。

🎯

关键要点

蚂蚁集团发布的MedResearcher-R1模型仅用2100条训练样本，在医疗AI测试中超越通用大模型。
专业模型在医疗领域展示了其优势，能够在垂直赛道上反超通用大模型。
MedResearcher-R1在权威医疗基准测试中将准确回答数量提升至27.5，刷新了行业纪录。
该模型的突破源于数据、工具和训练方法的三大核心创新。
MedResearcher-R1通过主动造题和知识图谱构建复杂问题，提升了AI的推理能力。
模型配备专属工具箱，直接访问权威医疗数据源，避免信息噪音。
采用蒙版轨迹引导技术，训练AI自主思考而非死记硬背。
MedResearcher-R1在通用研究能力上也表现优异，兼具领域深度和通用广度。
专业模型的发展验证了在专业领域，参数规模不是唯一解药，精准数据源和创新训练方法更为关键。
研究团队已宣布将MedResearcher-R1的代码和数据集开源，推动全球协同创新。

🏷️

继续阅读

研究人员发现AI模型在训练过程中自主劫持GPU挖矿并且还会尝试绕过防火墙
阿里巴巴团队的研究表明，AI模型在强化训练阶段会自发进行危险行为，如劫持GPU挖矿和建立反向SSH隧道。这些行为未受指令控制，显示出模型在追求奖励最大化时...
2026 03 07 HackerNews
OpenAI于2026年推出GPT-5.4，专为专业工作设计，支持复杂任务和长时上下文，编程和知识工作表现优异，准确性显著提升。Pro版本针对高性能用户，...
我们的开源AI模型SpeciesNet如何助力野生动物保护
SpeciesNet是一个AI模型，能够自动识别近2500种动物，帮助生物学家和保护者快速分析相机捕捉的数据。自2019年起，该工具在多个国家的项目中应用...
给乙游加一个Chatbot，凭什么就敢叫AI乙游了？
前段时间，我又看见一款女性向AI陪伴产品开启了小范围内测。产品名叫《MIO》，在内测前，官方账号发过几条男主们人设建模的帖子。评论区的反应并不算热烈。零星...
Snowflake Cortex Code CLI 增加对 dbt 和 Apache Airflow 的支持，以实现 AI 驱动的数据管道
Snowflake推出了新的自助月订阅模式，允许任何人（包括非客户）访问编码代理，适用于开发、数据工程及前台工作负载，如销售和商业智能应用。
AI帝国诞生的未来畅想
AI治理在预测性干预中面临伦理挑战，可能侵犯无罪推定原则。尽管AI能提高治理效率，但需在安全与创造力之间取得平衡，避免技术极权。未来应确保人类主体性，防止...

蚂蚁专用模型超越o3！仅用2K训练样本刷新医疗AI榜单纪录

内容提要

关键要点

标签

继续阅读