dotNET跨平台 ·

Phi小模型开发教程：C#使用本地模型Phi视觉模型分析图像，实现图片分类、搜索等功能...

💡 原文中文，约7300字，阅读约需18分钟。

📝

内容提要

文章介绍了如何使用AI模型Phi-vision进行图片分类和搜索。该模型具备语言和视觉能力，支持图像识别。用户可通过下载onnx模型并创建控制台应用，实现图像处理和描述功能。示例代码展示了模型加载、图像处理及描述生成的过程，模型在不同类型图片上的识别效果各异，展现了其应用潜力。

🎯

🔎

Phi-vision模型结合了语言和视觉能力，能够处理图像并生成描述。这种多模态特性使其在图像分类和搜索中具有广泛的应用潜力，尤其是在需要同时理解文本和图像内容的场景中。

模型在不同类型图像上的识别效果存在显著差异。虽然在风景和物品的描述上表现良好，但对知名人物的识别能力较弱，可能影响其在社交媒体或新闻应用中的实用性。

用户在下载和使用Phi-vision模型时，应根据自己的硬件配置选择合适的CPU或GPU版本。此外，安装依赖库时需注意版本兼容性，以确保模型的正常运行。

❓

用户可以下载Phi-vision的onnx模型，并创建控制台应用来实现图片分类功能。

Phi-vision是一个拥有42亿参数的多模态模型，具备语言和视觉能力。

在创建控制台应用时，需要安装依赖库Microsoft.ML.OnnxRuntimeGenAI。

模型在识别房屋、风景和汽车等物品时表现良好，但对知名人物的识别效果不佳。

用户需要创建一个控制台应用，定义模型路径和图像路径，并使用示例代码加载和处理图像。

Phi-vision的onnx模型下载链接为：https://hf-mirror.com/microsoft/Phi-3.5-vision-instruct-onnx/tree/main。

🏷️