Liquid AI 发布了 LFM2-VL-3B,这是一个具有 30 亿参数的视觉语言模型,专用于图像文本到文本任务。该模型提高了准确率并保持了处理速度,支持高达 512×512 的图像输入,适合边缘设备使用,评估得分具有竞争力。
完成下面两步后,将自动完成登录并继续当前操作。