手机上能跑的 GPT-4V!面壁发布端侧最强多模态小钢炮 2.6,实时视频理解首次上端
原文中文,约3000字,阅读约需8分钟。发表于: 。面壁发布端侧最强多模态小钢炮 2.6#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。 爱范儿 | 原文链接 · 查看评论 · 新浪微博
面壁智能发布了MiniCPM-V 2.6模型,提升了端侧多模态能力,超越了GPT-4V。该模型具有实时视频理解、多图联合、ICL视觉学习、OCR等功能,编码像素密度是GPT-4o的两倍,视觉token数量比同类模型低75%,内存占用量小,推理速度快。MiniCPM-V 2.6在多个评测平台上取得了优秀成绩,采用了统一高清视觉架构,实现了一通百通的功能。面壁智能将继续推出更多优质的端侧AI模型。