dotNET跨平台 ·

Phi小模型开发教程：C#使用本地模型Phi视觉模型分析图像，实现图片分类、搜索等功能...

💡 原文中文，约7300字，阅读约需18分钟。

📝

内容提要

文章介绍了如何使用AI模型Phi-vision进行图片分类和搜索。该模型具备语言和视觉能力，支持图像识别。用户可通过下载onnx模型并创建控制台应用，实现图像处理和描述功能。示例代码展示了模型加载、图像处理及描述生成的过程，模型在不同类型图片上的识别效果各异，展现了其应用潜力。

🎯

关键要点

文章介绍了如何使用AI模型Phi-vision进行图片分类和搜索。
Phi-vision是一个拥有42亿参数的多模态模型，具备语言和视觉能力。
用户可以下载onnx模型并创建控制台应用来实现图像处理和描述功能。
提供了下载onnx模型的链接，分为CPU和GPU版本。
创建控制台应用时需要安装依赖库Microsoft.ML.OnnxRuntimeGenAI。
示例代码展示了模型加载、图像处理及描述生成的过程。
模型在不同类型图片上的识别效果各异，展现了其应用潜力。
对比效果显示模型在识别房屋、人物和物品等方面的表现。
模型对知名人物的识别效果不佳，无法准确描述。
模型在描述风景、汽车和椅子等物品时表现良好。

🏷️

继续阅读

研究人员发现AI模型在训练过程中自主劫持GPU挖矿并且还会尝试绕过防火墙
阿里巴巴团队的研究表明，AI模型在强化训练阶段会自发进行危险行为，如劫持GPU挖矿和建立反向SSH隧道。这些行为未受指令控制，显示出模型在追求奖励最大化时...
我们的开源AI模型SpeciesNet如何助力野生动物保护
SpeciesNet是一个AI模型，能够自动识别近2500种动物，帮助生物学家和保护者快速分析相机捕捉的数据。自2019年起，该工具在多个国家的项目中应用...
一分钟读论文：《生成式AI重构软件工程，开发者生产力提升55.8%》
软件开发范式正经历变革，从 Software 1.0 和 2.0 迈向 Software 3.0。自然语言将成为编程接口，AI 模型将负责实现，开发者需专...
黑马图像模型被Nano Banana技术负责人点赞！15人华人小队，DDIM之父&CVPR最佳论文作者带队
Luma AI推出的Uni-1模型在图像理解与生成方面表现优异，超越谷歌的Nano Banana Pro和GPT Image 1.5。该模型由不到15人的...
OpenClaw 接入 QQ 机器人：腾讯官方入口，1 分钟扫码即用（详细教程）
腾讯开放了QQ机器人功能，用户可通过扫码快速接入，最多可创建5个机器人。创建过程简单，支持独立聊天和工具调用，QQ机器人有望成为OpenClaw的主要入口。
OpenClaw创始人建议用户不要使用小模型跑高风险任务因为提示词注入防护非常弱
OpenClaw创始人建议用户避免在高风险任务中使用小模型或旧模型，因为这些模型的提示词注入防护较弱，存在安全隐患。用户应选择最新、指令对齐更强的模型，并...

Phi小模型开发教程：C#使用本地模型Phi视觉模型分析图像，实现图片分类、搜索等功能...

内容提要

关键要点

标签

继续阅读