Phi小模型开发教程:C#使用本地模型Phi视觉模型分析图像,实现图片分类、搜索等功能...
💡
原文中文,约7300字,阅读约需18分钟。
📝
内容提要
文章介绍了如何使用AI模型Phi-vision进行图片分类和搜索。该模型具备语言和视觉能力,支持图像识别。用户可通过下载onnx模型并创建控制台应用,实现图像处理和描述功能。示例代码展示了模型加载、图像处理及描述生成的过程,模型在不同类型图片上的识别效果各异,展现了其应用潜力。
🎯
关键要点
- 文章介绍了如何使用AI模型Phi-vision进行图片分类和搜索。
- Phi-vision是一个拥有42亿参数的多模态模型,具备语言和视觉能力。
- 用户可以下载onnx模型并创建控制台应用来实现图像处理和描述功能。
- 提供了下载onnx模型的链接,分为CPU和GPU版本。
- 创建控制台应用时需要安装依赖库Microsoft.ML.OnnxRuntimeGenAI。
- 示例代码展示了模型加载、图像处理及描述生成的过程。
- 模型在不同类型图片上的识别效果各异,展现了其应用潜力。
- 对比效果显示模型在识别房屋、人物和物品等方面的表现。
- 模型对知名人物的识别效果不佳,无法准确描述。
- 模型在描述风景、汽车和椅子等物品时表现良好。
❓
延伸问答
如何使用Phi-vision模型进行图片分类?
用户可以下载Phi-vision的onnx模型,并创建控制台应用来实现图片分类功能。
Phi-vision模型的参数和能力是什么?
Phi-vision是一个拥有42亿参数的多模态模型,具备语言和视觉能力。
如何安装Phi-vision模型所需的依赖库?
在创建控制台应用时,需要安装依赖库Microsoft.ML.OnnxRuntimeGenAI。
Phi-vision模型在不同类型图片上的识别效果如何?
模型在识别房屋、风景和汽车等物品时表现良好,但对知名人物的识别效果不佳。
如何创建控制台应用来使用Phi-vision模型?
用户需要创建一个控制台应用,定义模型路径和图像路径,并使用示例代码加载和处理图像。
Phi-vision模型的下载链接是什么?
Phi-vision的onnx模型下载链接为:https://hf-mirror.com/microsoft/Phi-3.5-vision-instruct-onnx/tree/main。
➡️