小红花·文摘

科研AI出了个狠角色：开源30B小模型，硬刚Gemini和Claude

量子位 ·

OpenClaw创始人建议用户不要使用小模型跑高风险任务因为提示词注入防护非常弱

蓝点网 ·

林俊旸离开的48小时：一条朋友圈、一个小模型、和一个万亿美金的假设

爱范儿 ·

[实验性] 有开发者破解苹果ANE神经网络引擎原来M4芯片也能直接训练小模型

蓝点网 ·

ELM 架构突破：Modulate 用 100+ 个小模型打败 LLM，开启语音 AI 新时代

Micropaper ·

ICLR 2026 | 7B小模型干翻GPT-5？AdaResoner实现Agentic Vision的主动「视觉工具思考」

机器之心 ·

Loop-ViT：让AI学会「反复思考」，3.8M参数小模型追平人类平均水平

机器之心 ·

蚂蚁推出AlignXplore+，通过文本化用户建模实现个性化，突破传统推荐系统的局限。该模型具备全域通用、极致迁移和实战适配三大特性，能够有效理解用户偏好，提升个性化应用的准确性和鲁棒性。

蚂蚁用8B小模型构建用户“话”像，跨任务跨模型通用且SOTA

量子位 ·

DeepSeek发布了新OCR模型DeepSeek-OCR 2，采用轻量化Qwen2-0.5B模型，性能接近Gemini-3 Pro。该模型通过DeepEncoder V2实现视觉标记智能重排，提升PDF转Markdown的准确性，基于OmniDocBench v1.5测试显示性能提升3.73%。

DeepSeek开源全新OCR模型！弃用CLIP改用Qwen轻量小模型，性能媲美Gemini-3 Pro

量子位 ·

中兴Nebula小模型为手机提供AI助手功能，支持“一句话点餐”等操作，准确率超过90%。该技术通过自研数据系统提升数据质量，未来将扩展至更多APP，推动手机智能化发展。

聚焦手机AI“超级入口”，中兴Nebula小模型让手机秒变“小秘”？

量子位 ·

Thinking Machine的新研究提出了一种名为在线策略蒸馏的方法，结合强化学习与微调，显著提高小模型的训练效率，减少训练步骤50-100倍，适合资源有限的个人和小公司。同时，该方法有效解决了AI的“灾难性遗忘”问题，支持模型的终身学习。

Thinking Machine新研究刷屏！结合RL+微调，小模型训练更具性价比

量子位 ·

斯坦福团队的AgentFlow系统通过在线强化学习优化智能体，显著提升推理能力，超越GPT-4o等大型模型。该系统由四个专业智能体协作，实时优化决策，尤其在知识检索和智能体任务中提升超过14%，展示了模块化设计和动态学习的重要性。

AI在线强化学习“边做边学”，斯坦福团队让7B小模型性能飙升，甚至超越GPT-4o

量子位 ·

港科大 X MiniMax：高质量数据、小模型挑战复杂网络搜索难题

机器之心 ·

NVIDIA推出了轻量级大语言模型Nemotron-Nano-9B-v2，结合Mamba和Transformer技术，支持128K超长上下文，推理能力强，适合小型设备。该模型在准确率和吞吐量上优于同规模的开源模型，标志着轻量化部署的突破。

在线教程丨英伟达力推小模型，小而精的Nemotron-Nano-9B-v2比Qwen3快6倍

HyperAI超神经 ·

英伟达推出了新型小型语言模型Nemotron Nano v2，参数为90亿，速度比Qwen3快6倍，准确率相当。该模型在20万亿token上预训练，并开源大部分数据集，支持复杂推理和思考预算控制。

英伟达开源9B参数小模型，比Qwen3快6倍

量子位 ·

英伟达研究显示，小模型在Agent任务中更具经济性和灵活性，能够有效替代大模型。通过优化硬件资源和任务设计，小模型降低了计算成本，适合本地部署。尽管面临基础设施适配和市场认知度低的挑战，小模型在特定任务中展现出良好潜力。

英伟达新研究：小模型才是智能体的未来

量子位 ·

王冠开发的27M小模型HRM采用仿脑设计，克服了Transformer的局限性。通过分层循环模块和近似梯度技术，HRM实现了高效推理，准确率超过大型模型。尽管参数较少，HRM在特定任务中表现优异，展现出新架构的潜力。

又是王冠：27M小模型超越o3-mini！拒绝马斯克的00后果然不同

量子位 ·

手机也能跑，腾讯混元一口气开源4款小模型

机器之心 ·

香港大学、字节跳动Seed和复旦大学联合推出的Polaris方法，通过700步强化学习训练，使4B模型在数学推理能力上超越多款商业大模型，特别是在长文本生成方面表现突出。该方法强调动态调整训练数据和超参数，提升了模型的多样性和准确性。

4B小模型数学推理首超Claude 4，700步RL训练逼近235B性能 | 港大&字节Seed&复旦

量子位 ·

本文探讨了NVIDIA的小模型（SLM）在AI代理中的未来，认为SLM在性能、经济性和适应性方面优于大模型（LLM），能够高效处理特定任务，降低成本并提高灵活性。未来AI架构将从“大模型单体”转向“小模型微服务”，实现更高效的系统设计。

NVIDIA 的颠覆性观点：AI Agent 的未来，属于小模型 (SLM)

Tony Bai ·

科研AI出了个狠角色：开源30B小模型，硬刚Gemini和Claude

OpenClaw创始人建议用户不要使用小模型跑高风险任务 因为提示词注入防护非常弱

林俊旸离开的48小时：一条朋友圈、一个小模型、和一个万亿美金的假设

[实验性] 有开发者破解苹果ANE神经网络引擎 原来M4芯片也能直接训练小模型

ELM 架构突破：Modulate 用 100+ 个小模型打败 LLM，开启语音 AI 新时代

ICLR 2026 | 7B小模型干翻GPT-5？AdaResoner实现Agentic Vision的主动「视觉工具思考」

Loop-ViT：让AI学会「反复思考」，3.8M参数小模型追平人类平均水平

蚂蚁用8B小模型构建用户“话”像，跨任务跨模型通用且SOTA

DeepSeek开源全新OCR模型！弃用CLIP改用Qwen轻量小模型，性能媲美Gemini-3 Pro

聚焦手机AI“超级入口”，中兴Nebula小模型让手机秒变“小秘”？

Thinking Machine新研究刷屏！结合RL+微调，小模型训练更具性价比

AI在线强化学习“边做边学”，斯坦福团队让7B小模型性能飙升，甚至超越GPT-4o

港科大 X MiniMax：高质量数据、小模型挑战复杂网络搜索难题

在线教程丨英伟达力推小模型，小而精的Nemotron-Nano-9B-v2比Qwen3快6倍

英伟达开源9B参数小模型，比Qwen3快6倍

英伟达新研究：小模型才是智能体的未来

又是王冠：27M小模型超越o3-mini！拒绝马斯克的00后果然不同

手机也能跑，腾讯混元一口气开源4款小模型

4B小模型数学推理首超Claude 4，700步RL训练逼近235B性能 | 港大&字节Seed&复旦

NVIDIA 的颠覆性观点：AI Agent 的未来，属于小模型 (SLM)

OpenClaw创始人建议用户不要使用小模型跑高风险任务因为提示词注入防护非常弱

[实验性] 有开发者破解苹果ANE神经网络引擎原来M4芯片也能直接训练小模型