内容提要
面壁智能发布了2B旗舰端侧大模型面壁MiniCPM,超越了欧洲版OpenAI的性能标杆,整体领先于Google Gemma 2B量级,还比肩7B、13B量级模型。MiniCPM-V2.0多模态模型在OCR能力上显著增强,通用能力超越Qwen-VL-Chat-10B、CogVLM-Chat-17B、Yi-VL-34B等更大的模型。MiniCPM-V2.0与清华大学合作,能识别高清大图和长文本。MiniCPM-MoE-8x2B MoE性能超越全系7B量级模型,推理成本仅为Gemma-7B的69.7%。MiniCPM-1.2B模型保持上一代2.4B模型87%的综合性能,在多个测试榜单上表现优异。MiniCPM-1.2B模型在iPhone 15手机上推理速度提升38%。面壁智能选择研发体积更小、性能更强的模型。
关键要点
-
面壁智能发布了2B旗舰端侧大模型面壁MiniCPM,超越了欧洲版OpenAI的性能标杆。
-
MiniCPM-V2.0多模态模型在OCR能力上显著增强,通用能力超越Qwen-VL-Chat-10B等更大的模型。
-
MiniCPM-V2.0与清华大学合作,能识别高清大图和长文本。
-
MiniCPM-MoE-8x2B MoE性能超越全系7B量级模型,推理成本仅为Gemma-7B的69.7%。
-
MiniCPM-1.2B模型保持上一代2.4B模型87%的综合性能,在多个测试榜单上表现优异。
-
MiniCPM-1.2B模型在iPhone 15手机上推理速度提升38%。
-
面壁智能选择研发体积更小、性能更强的模型,证明了小与强可以和谐共存。
延伸问答
MiniCPM的主要性能优势是什么?
MiniCPM在性能上超越了欧洲版OpenAI和Google Gemma,尤其在OCR能力和多模态识别上表现优异。
MiniCPM-V2.0与清华大学的合作有什么意义?
MiniCPM-V2.0与清华大学合作,探索清华简的识别能力,推动多模态技术的发展。
MiniCPM-1.2B模型的性能如何?
MiniCPM-1.2B模型保持了上一代2.4B模型87%的综合性能,并在多个测试中表现优异。
MiniCPM在长文本处理方面有什么突破?
MiniCPM-2B-128K模型将上下文窗口扩展到128K,显著提升了长文本处理能力。
MiniCPM的推理成本与其他模型相比如何?
MiniCPM-MoE-8x2B的推理成本仅为Gemma-7B的69.7%,显示出更高的性价比。
面壁智能的融资情况如何?
面壁智能完成了新一轮数亿元融资,由春花创投和华为哈勃领投,旨在加快大模型的应用落地。