量子位 ·

阿里通义开源「推理+搜索」预训练新框架：小模型媲美大模型，多个开放域问答数据集表现显著提升

💡 原文中文，约3200字，阅读约需8分钟。

📝

内容提要

阿里通义实验室推出MaskSearch框架，提升大模型推理与搜索能力。小模型表现接近大模型，兼容监督微调和强化学习，显著提升开放域问答性能。通过检索增强型掩码预测任务，模型有效学习信息处理与搜索引擎使用，适应多领域任务。

🎯

关键要点

阿里通义实验室推出MaskSearch框架，提升大模型推理与搜索能力。
小模型表现接近大模型，兼容监督微调和强化学习。
MaskSearch通过检索增强型掩码预测任务有效学习信息处理与搜索引擎使用。
MaskSearch的预训练任务为检索增强型掩码预测（RAMP），模型需借助外部知识库预测被掩盖的文本片段。
MaskSearch在多个开放域问答数据集上显著提升性能，尤其在领域外数据集上表现突出。
监督微调和强化学习两种训练方式与MaskSearch框架兼容，RL在RAMP任务上展现更高性能。
课程学习策略通过难度分级训练样本，帮助模型逐步提升推理能力。
掩码策略和奖励函数对模型性能有显著影响，需与模型能力匹配以获得最佳效果。
MaskSearch致力于提升大型语言模型的智能体推理与搜索能力，实现外部知识的深度整合。

❓

延伸问答

MaskSearch框架的主要功能是什么？

MaskSearch框架旨在提升大模型的推理与搜索能力，尤其在开放域问答任务中表现显著。

小模型在MaskSearch框架下的表现如何？

小模型在MaskSearch框架下的表现接近大模型，显示出显著的性能提升。

MaskSearch如何进行预训练？

MaskSearch通过检索增强型掩码预测任务（RAMP）进行预训练，模型需借助外部知识库预测被掩盖的文本片段。

MaskSearch框架支持哪些训练方法？

MaskSearch框架兼容监督微调（SFT）和强化学习（RL）两种训练方法。

课程学习策略在MaskSearch中的作用是什么？

课程学习策略通过难度分级训练样本，帮助模型逐步提升推理能力。

MaskSearch在开放域问答数据集上的表现如何？

MaskSearch在多个开放域问答数据集上显著提升性能，尤其在领域外数据集上表现突出。

🏷️

继续阅读

大模型 Temperature 与 Top_p/Top_k 参数详解
本文讨论了大模型输出的两个重要超参数：温度（Temperature）和核采样（Top-p）。温度控制输出的随机性，低温度使输出更确定，高温度增加多样性。核...
现代化Facebook群组搜索，释放社区知识的力量
Facebook对群组搜索进行了重大改进，采用混合检索架构，提升了用户发现和验证社区内容的能力。新系统通过并行检索策略和多任务模型优化，解决了用户在搜索时...
改编自“巴西鲁迅”著作的推理游戏，让我成为了时间管理大师
严肃文学改编成游戏，又何必要严肃。时间循环题材的电影里，总是会出现这样的情形：主人公困在一段时间中，需要从不断重复的事件中找到破解之法，打破循环。循环给人...
Eclipse基金会推出企业级开源替代方案，取代微软的VS Code市场
Eclipse基金会推出了Open VSX托管注册中心，这是首个由基金会运营的开源开发者基础设施服务。该平台为开发者提供开放、可靠的扩展注册库，支持AI驱...
Mozilla 发布开源 AI 客户端 Thunderbolt，聊天、搜索、调研、自动化，自托管/隐私优先
Mozilla 发布了开源 AI 客户端 Thunderbolt，支持本地部署，强调用户隐私。该客户端提供聊天、搜索、调研和任务自动化功能，能够接入企业内...
戴盟机器人发布全模态物理世界数据集Daimon-Infinity
戴盟机器人发布了全球最大规模的全模态物理世界数据集Daimon-Infinity，涵盖触觉、视觉等多维信息，计划形成数百万小时的数据。该数据集将用于真实场...