Phi小模型开发教程:C#使用本地模型Phi视觉模型分析图像,实现图片分类、搜索等功能...

💡 原文中文,约7300字,阅读约需18分钟。
📝

内容提要

文章介绍了如何使用AI模型Phi-vision进行图片分类和搜索。该模型具备语言和视觉能力,支持图像识别。用户可通过下载onnx模型并创建控制台应用,实现图像处理和描述功能。示例代码展示了模型加载、图像处理及描述生成的过程,模型在不同类型图片上的识别效果各异,展现了其应用潜力。

🎯

关键要点

  • 文章介绍了如何使用AI模型Phi-vision进行图片分类和搜索。
  • Phi-vision是一个拥有42亿参数的多模态模型,具备语言和视觉能力。
  • 用户可以下载onnx模型并创建控制台应用来实现图像处理和描述功能。
  • 提供了下载onnx模型的链接,分为CPU和GPU版本。
  • 创建控制台应用时需要安装依赖库Microsoft.ML.OnnxRuntimeGenAI。
  • 示例代码展示了模型加载、图像处理及描述生成的过程。
  • 模型在不同类型图片上的识别效果各异,展现了其应用潜力。
  • 对比效果显示模型在识别房屋、人物和物品等方面的表现。
  • 模型对知名人物的识别效果不佳,无法准确描述。
  • 模型在描述风景、汽车和椅子等物品时表现良好。
➡️

继续阅读