小红花·文摘

消费级显卡可以快速上手跑！面壁智能MiniCPM-o 4.5发技术报告

量子位 ·

当多模态开始卷落地：MiniCPM-o-4.5仅9B覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

HyperAI超神经 ·

面壁智能推出的全模态模型MiniCPM-o4.5，具备边看边听和主动应答能力，能够实时识别环境变化并进行对话。与传统AI不同，它支持全双工交互，提升了用户体验，适用于多种场景，标志着端侧AI的新发展方向。

面壁智能开源全模态模型MiniCPM-o4.5，边看边听还能主动抢答

量子位 ·

清华大学与面壁智能推出的MiniCPM-V 4.0模型，参数减少至4.1B，提升了移动端图像理解能力，并支持iOS应用，推动了端侧部署的广泛应用。

性能赶超GPT-4.1-mini！MiniCPM-V 4.0达端侧图像模型新高度；HelpSteer3让AI回应更接近人类思维

HyperAI超神经 ·

清华大学与面壁智能推出的MiniCPM-V 4.0端侧大模型，具备强大的图像理解能力，参数减少至4.1B，适用于移动设备，提升用户体验，推动AI在边缘设备的应用。

性能赶超GPT-4.1-mini！MiniCPM-V 4.0达端侧图像模型新高度；HelpSteer3让AI回应更接近人类思维

HyperAI超神经 ·

如何在本地安装和运行MiniCPM-o2.6多模态大语言模型

DEV Community ·

OpenBMB发布MiniCPM-o 2.6：一种灵活的多模态模型，可理解视觉、语音和语言并在边缘设备上运行

实时互动网 ·

清华、厦大等提出的LLMxMapReduce技术突破了大模型的记忆限制，实现了“无限长”上下文。该技术通过将长文本切分为片段并并行处理，提取关键信息并汇总答案。实验表明，结合此框架的模型在处理超长文本时表现优异且速度较快，具有广泛的应用潜力。

清华厦大等提出“无限长上下文”技术，100万大海捞针全绿，Llama\Qwen\MiniCPM都能上分

量子位 ·

这篇文章讨论了MiniCPM-Llama3-V 2.5和Llama3-V之间的剽窃争议。有人认为Llama3-V从MiniCPM-Llama3-V 2.5中窃取了大量作品，但也有人认为这只是版本升级。一些人对Llama3-V的作者的行为表示质疑，并公布了证据。参与推广者向MiniCPM的原作者道歉，并删除了对Llama3V的引用。网友对此事持不同意见，有人认为道歉不够，有人认为这只是程序员的习惯。还有人指出中国的大模型被忽视了。

小偷？MiniCPM-Llama3-V 2.5与Llama3-V剽窃之争

极道 ·

面壁智能完成新一轮数亿元融资，发布性能小钢炮 MiniCPM 第二弹

爱范儿 ·

这篇文章介绍了如何在本地运行Mini CPM 2B SFT / DPO版本的模型。首先，准备模型的运行环境和下载CPM模型。然后，编写推理程序并启动Docker容器来体验模型。文章还展示了一些简单的测试结果。

本地运行面壁智能的“贺岁模型”：MiniCPM 2B

苏洋博客 ·

大模型「瘦身」进手机，面壁智能发布性能小钢炮 MiniCPM

爱范儿 ·