机器之心 ·

仅8B参数，可与GPT-4媲美，上交大团队构建多语言医学大模型

💡 原文中文，约3800字，阅读约需9分钟。

📝

内容提要

上海交通大学研究团队开发了多语言医学语料库MMedC，涵盖六种语言的255亿个医学token，并提出了多语言医学基准MMedBench。其模型MMed-Llama 3性能优于其他开源模型，接近GPT-4。研究强调多语言医学语料库的重要性，推动医学AI发展，改善跨语言医疗沟通和教育。结果显示，强大的基础语言模型和多样化数据源能显著提升性能。

🎯

关键要点

上海交通大学研究团队开发了多语言医学语料库MMedC，涵盖六种语言的255亿个医学token。
提出了多语言医学基准MMedBench，用于监测多语言医学LLM的发展。
模型MMed-Llama 3在MMedBench和英语基准上表现优异，接近GPT-4。
研究强调多语言医学语料库的重要性，推动医学AI发展，改善跨语言医疗沟通和教育。
MMedC是第一个专门针对多语言医学领域构建的语料库，数据来自多种来源。
MMedBench包含53,566个QA对，涵盖21个医学领域，提供多项选择题和合理性推理。
评估阶段对11个现有的多语言支持LLM进行了全面测试，采用双重评估方法。
研究结果显示，MMedC的自回归训练和多样化数据源显著提升了模型性能。
强大的基础LLM和多语言能力的增强有助于提高医学领域的适应性表现。
多语言医学LLM可以消除语言障碍，促进有效沟通，改善医疗服务质量。
这些模型还可以帮助医学教育，提供多种语言的教育材料，确保全球一致的护理质量。

🏷️

继续阅读

谁能通过真实世界考验？ATEC2026发起具身智能“图灵测试”
ATEC2026“人工智能与机器人真实世界极限挑战”赛事正式启动，聚焦具身智能在开放环境中的能力验证。赛事包括线上赛、线下预选赛和决赛，考察机器人在复杂任...
Browser Harness是一种浏览器操控工具：让大模型自主完成任务！
Browser Harness是一种自愈式浏览器操控工具，允许大语言模型自主完成任务。它通过CDP协议与Chrome直接连接，去除了传统框架的限制。该工具...
谷歌照片新增人脸细微修饰工具
谷歌推出了新的照片编辑工具，专注于人脸细微修饰，包括去除瑕疵、美白牙齿和平滑肌肤，并可调整效果强度，确保修饰自然。该功能正在全球范围内逐步推出，适用于An...
Insta360将在其下一款无线麦克风上配备屏幕，以显示标志或图像
Insta360推出的新款无线麦克风Mic Pro，配备可定制的E Ink彩色屏幕，具备三麦克风阵列和AI处理器，支持降噪功能，并可直接与多款相机连接，确...
梅赛德斯-奔驰首款全电动C级车型是其迄今为止最运动的一款
梅赛德斯-奔驰推出全电动C 400 4MATIC，这是C级系列首次采用专为电动设计的车型。该车具备800伏架构，续航可达762公里，支持快速充电和双向充电...
是的，您可以在Postgres中进行混合搜索（而且您可能应该这样做）
文章讨论了在Postgres中应用混合搜索，结合传统全文搜索和向量搜索的优缺点，用户可以在同一数据库中高效检索信息，简化了使用多个数据库的复杂性。Post...

仅8B参数，可与GPT-4媲美，上交大团队构建多语言医学大模型

内容提要

关键要点

标签

继续阅读