Phi小模型开发教程:C#使用本地模型Phi视觉模型分析图像,实现图片分类、搜索等功能...
💡
原文中文,约7300字,阅读约需18分钟。
📝
内容提要
文章介绍了如何使用AI模型Phi-vision进行图片分类和搜索。该模型具备语言和视觉能力,支持图像识别。用户可通过下载onnx模型并创建控制台应用,实现图像处理和描述功能。示例代码展示了模型加载、图像处理及描述生成的过程,模型在不同类型图片上的识别效果各异,展现了其应用潜力。
🎯
关键要点
- 文章介绍了如何使用AI模型Phi-vision进行图片分类和搜索。
- Phi-vision是一个拥有42亿参数的多模态模型,具备语言和视觉能力。
- 用户可以下载onnx模型并创建控制台应用来实现图像处理和描述功能。
- 提供了下载onnx模型的链接,分为CPU和GPU版本。
- 创建控制台应用时需要安装依赖库Microsoft.ML.OnnxRuntimeGenAI。
- 示例代码展示了模型加载、图像处理及描述生成的过程。
- 模型在不同类型图片上的识别效果各异,展现了其应用潜力。
- 对比效果显示模型在识别房屋、人物和物品等方面的表现。
- 模型对知名人物的识别效果不佳,无法准确描述。
- 模型在描述风景、汽车和椅子等物品时表现良好。
➡️