微软推出可查看图像的小型语言模型
原文英文,约300词,阅读约需1分钟。发表于: 。Illustration: The Verge Microsoft announced a new version of its small language model, Phi-3, which can look at images and tell you what’s in them. Phi-3-vision is a multimodal model — aka it can...
微软发布了Phi-3-vision,一种小型语言模型,可查看图像并告知内容。Phi-3-vision是多模态模型,适用于移动设备。与其他以图像为重点的AI模型相比,Phi-3-vision更小。Phi-3-vision不生成图像,但可理解图像内容并进行分析。Phi-3-vision现已在预览版中提供,其他Phi-3家族成员也通过Azure模型库提供。