量子位 ·

全球首次！国产AI开源端侧GPT-4o海外爆火，8B参数iPad就能跑

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

国产AI开源模型MiniCPM-o 2.6在海外受到关注，具备8B参数，能够在iPad上运行，支持实时视频通话和高级语音理解。其多模态能力与GPT-4o相当，能精准识别声音和图像，适合边端设备，推动AI原生应用发展。

🎯

🔎

MiniCPM-o 2.6的多模态能力使其在实时交互中表现出色，能够同时处理文本、图像和音频数据。这种能力不仅提升了用户体验，还为智能设备的应用场景拓展提供了可能，尤其是在需要快速反应的场合，如智能眼镜和语音助手等。

MiniCPM-o 2.6的开源特性使得开发者能够在此基础上进行二次开发，推动AI原生应用的创新。开源不仅降低了技术门槛，也促进了社区的合作与共享，可能会加速AI技术的普及和应用。

该模型的设计专注于边端设备的高效性，使得在移动设备上运行大型AI模型成为可能。这一特性对于视障人士等特定用户群体尤为重要，因为它能够在不依赖网络的情况下提供实时服务，提升他们的生活质量。

❓

MiniCPM-o 2.6具备8B参数，支持实时视频通话和高级语音理解，能够在iPad上运行，具备多模态能力，精准识别声音和图像。

在多项评测中，MiniCPM-o 2.6的能力与GPT-4o相当，甚至在某些细分项目中超越了GPT-4o。

MiniCPM-o 2.6采用端到端全模态架构，综合处理文本、图像和音频数据，通过交叉熵损失进行训练，支持流式输入输出。

MiniCPM-o 2.6适合在智能眼镜等设备上使用，特别对视障人士友好，能够在嘈杂环境中正常工作。

MiniCPM-o 2.6已在GitHub和Hugging Face开源，用户可以免费使用在线demo。

面壁智能的目标是实现AI原生应用与硬件的结合，推动端侧大模型的发展，提高单设备服务的高效性。

🏷️