本研究提出NOVA基准,用于评估模型在脑MRI异常定位和临床推理中的能力。NOVA包含约900个脑MRI扫描和281种罕见病理,结果显示主流模型在处理这些异常时性能显著下降,反映出其在分布外推广能力的不足。
完成下面两步后,将自动完成登录并继续当前操作。