NVIDIA AI 发布 Llama Nemotron Nano VL:专为文档理解而优化的紧凑型视觉语言模型 NVIDIA 推出了Llama Nemotron Nano VL,这是一种视觉语言模型 (VLM),旨在高效、精准地处理文档级理解任务。该版本基于 Llama 3.1 架构构建,并... NVIDIA推出了Llama Nemotron Nano VL,这是一种高效的视觉语言模型,专注于文档理解,基于Llama 3.1架构,结合轻量级视觉编码器,支持多模态输入,优化标记推理。该模型在OCRBench v2中表现优异,适用于自动文档问答和智能OCR等应用。 Llama Nemotron Nano VL NVIDIA OCR ai llama nemotron 文档理解 视觉语言模型 语言模型