机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。
本研究提出了MedXpertQA,这是一个全面且具有挑战性的基准,用于评估专家级医学知识和高级推理能力。该基准涵盖4460个问题,涉及17个专业和11个身体系统,旨在填补现有评估的不足,对医学决策具有潜在影响。
完成下面两步后,将自动完成登录并继续当前操作。