Phi小模型开发教程:C#使用本地模型Phi视觉模型分析图像,实现图片分类、搜索等功能...

💡 原文中文,约7300字,阅读约需18分钟。
📝

内容提要

文章介绍了如何使用AI模型Phi-vision进行图片分类和搜索。该模型具备语言和视觉能力,支持图像识别。用户可通过下载onnx模型并创建控制台应用,实现图像处理和描述功能。示例代码展示了模型加载、图像处理及描述生成的过程,模型在不同类型图片上的识别效果各异,展现了其应用潜力。

🎯

关键要点

  • 文章介绍了如何使用AI模型Phi-vision进行图片分类和搜索。
  • Phi-vision是一个拥有42亿参数的多模态模型,具备语言和视觉能力。
  • 用户可以下载onnx模型并创建控制台应用来实现图像处理和描述功能。
  • 提供了下载onnx模型的链接,分为CPU和GPU版本。
  • 创建控制台应用时需要安装依赖库Microsoft.ML.OnnxRuntimeGenAI。
  • 示例代码展示了模型加载、图像处理及描述生成的过程。
  • 模型在不同类型图片上的识别效果各异,展现了其应用潜力。
  • 对比效果显示模型在识别房屋、人物和物品等方面的表现。
  • 模型对知名人物的识别效果不佳,无法准确描述。
  • 模型在描述风景、汽车和椅子等物品时表现良好。

延伸问答

如何使用Phi-vision模型进行图片分类?

用户可以下载Phi-vision的onnx模型,并创建控制台应用来实现图片分类功能。

Phi-vision模型的参数和能力是什么?

Phi-vision是一个拥有42亿参数的多模态模型,具备语言和视觉能力。

如何安装Phi-vision模型所需的依赖库?

在创建控制台应用时,需要安装依赖库Microsoft.ML.OnnxRuntimeGenAI。

Phi-vision模型在不同类型图片上的识别效果如何?

模型在识别房屋、风景和汽车等物品时表现良好,但对知名人物的识别效果不佳。

如何创建控制台应用来使用Phi-vision模型?

用户需要创建一个控制台应用,定义模型路径和图像路径,并使用示例代码加载和处理图像。

Phi-vision模型的下载链接是什么?

Phi-vision的onnx模型下载链接为:https://hf-mirror.com/microsoft/Phi-3.5-vision-instruct-onnx/tree/main。

➡️

继续阅读