本研究评估了多模态大语言模型在逻辑理解和代码生成方面的能力,并提出了新基准“代码视觉”。实验结果显示,专有模型与开源模型在性能上存在显著差异,揭示了开源模型面临的挑战。
完成下面两步后,将自动完成登录并继续当前操作。