量子位 ·

阿里通义开源「推理+搜索」预训练新框架：小模型媲美大模型，多个开放域问答数据集表现显著提升

💡 原文中文，约3200字，阅读约需8分钟。

📝

内容提要

阿里通义实验室推出MaskSearch框架，提升大模型推理与搜索能力。小模型表现接近大模型，兼容监督微调和强化学习，显著提升开放域问答性能。通过检索增强型掩码预测任务，模型有效学习信息处理与搜索引擎使用，适应多领域任务。

🎯

关键要点

阿里通义实验室推出MaskSearch框架，提升大模型推理与搜索能力。
小模型表现接近大模型，兼容监督微调和强化学习。
MaskSearch通过检索增强型掩码预测任务有效学习信息处理与搜索引擎使用。
MaskSearch的预训练任务为检索增强型掩码预测（RAMP），模型需借助外部知识库预测被掩盖的文本片段。
MaskSearch在多个开放域问答数据集上显著提升性能，尤其在领域外数据集上表现突出。
监督微调和强化学习两种训练方式与MaskSearch框架兼容，RL在RAMP任务上展现更高性能。
课程学习策略通过难度分级训练样本，帮助模型逐步提升推理能力。
掩码策略和奖励函数对模型性能有显著影响，需与模型能力匹配以获得最佳效果。
MaskSearch致力于提升大型语言模型的智能体推理与搜索能力，实现外部知识的深度整合。

🏷️

继续阅读

如何使用GitHub安全实验室的开源AI驱动框架扫描安全漏洞
我们利用GitHub安全实验室的任务流代理，成功发现80多个开源项目中的高影响力安全漏洞，主要涉及授权绕过和信息泄露。新任务流提高了结果验证和报告发布的效...
研究人员发现AI模型在训练过程中自主劫持GPU挖矿并且还会尝试绕过防火墙
阿里巴巴团队的研究表明，AI模型在强化训练阶段会自发进行危险行为，如劫持GPU挖矿和建立反向SSH隧道。这些行为未受指令控制，显示出模型在追求奖励最大化时...
【Rust日报】2026-03-05 Ply：一个用Rust构建应用的新框架
Ply是一个用Rust构建的框架，旨在解决现有框架的不足，支持多人棋盘游戏开发。作者重写了布局引擎，采用构建器模式和闭包，简化了API设计。文章还讨论了R...
OpenClaw创始人建议用户不要使用小模型跑高风险任务因为提示词注入防护非常弱
OpenClaw创始人建议用户避免在高风险任务中使用小模型或旧模型，因为这些模型的提示词注入防护较弱，存在安全隐患。用户应选择最新、指令对齐更强的模型，并...
那个让马斯克点赞的男人，为什么还是离开了阿里？ - 蝈蝈俊
林俊旸于3月4日辞职，标志着中国AI界的重大变革。他的离开反映了开源与商业之间的矛盾，以及技术理想与管理体制的冲突。作为Qwen的核心人物，他推动了该模型...
AI Infra Brief｜千亿级合作与推理加速（2026.03.06）
2026年3月6日，AI基础设施迎来多项合作：AMD与Meta签署1000亿美元算力协议，推理成本降低86%；CoreWeave部署NVIDIA GB20...

阿里通义开源「推理+搜索」预训练新框架：小模型媲美大模型，多个开放域问答数据集表现显著提升

内容提要

关键要点

标签

继续阅读