量子位 ·

天下苦「调参」久矣！MIT师生推出全新RandOpt算法

💡 原文中文，约3000字，阅读约需7分钟。

📝

内容提要

MIT师生提出RandOpt算法，通过随机扰动参数简化预训练模型的调参过程，能够找到“专家”，效果与传统方法相当。研究表明，模型越大，随机改动的效果越明显，且无需复杂训练。此方法节省时间和算力，但依赖优质的预训练数据。

🎯

关键要点

MIT师生提出RandOpt算法，通过随机扰动参数简化预训练模型的调参过程。
RandOpt算法能够找到“专家”，效果与传统方法相当。
模型越大，随机改动的效果越明显，且无需复杂训练。
该方法节省时间和算力，但依赖优质的预训练数据。
预训练模型周围存在大量“专家模型”，只需在权重附近扰动参数即可找到。
实验表明，模型越大，周围“高精度区域”越密集。
随机扰动带来的不是“全能选手”，而是“偏科战神”。
RandOpt的运行机制为随机找高手和组队投票。
RandOpt在多任务混合预训练下效果更佳。
研究作者强调预训练模型是“一堆高手的集合”，无需复杂调参。
RandOpt的缺点包括依赖优质预训练和只能基于预训练数据找改进。

🏷️

继续阅读

从零到一：构建你的第一个量子算法
量子计算通过量子比特和量子门构建算法。以Deutsch问题为例，展示了量子叠加和纠缠的优势：经典方法需两次调用函数，而量子方法仅需一次，体现了量子计算的高效性。
LightLayer高性价比独服促销：美国 30M CN2 $57，香港 20M CN2 $165，支持自定义
Lightlayer推出两款独立服务器套餐：美国圣何塞月费57美元，配置30M CN2带宽、E5-2660处理器、16G内存；香港月费165美元，配置20...
🦞虾骑马！龙虾圈传了一周的匿名模型，原来是它｜附最新体验细节
龙虾圈推出的新模型GLM-5-Turbo专为复杂任务优化，解决了通用模型在多步骤执行中的问题。该模型在工具调用、指令遵循和任务持续性方面表现优异，并在ZC...
ZjiNet 韩国独立服务器推荐：双路E5-2620v3+50M带宽，450元/月
V5Net提供深港CNIX VPS，配备独享CNIX IP和香港原生IP，500M带宽每月仅需88元。
光打字就能生成爆火小游戏，游戏开发的门槛降到了地板？
重新认识到“降门槛”这个事情的价值。过去一段时间里，用VibeCoding做游戏，成了越来越热的话题。只要在社交平台上随手翻一翻，就能看到不少人用自然语言...
一手实测首个龙虾模型：长路径任务不失误，一人包揽全栈开发
智谱推出全球首个“龙虾特供”模型GLM-5-Turbo，优化了工具调用和多智能体协同能力，适用于复杂任务。用户可通过“澳龙”框架轻松调用模型，完成文案策划...

天下苦「调参」久矣！MIT师生推出全新RandOpt算法

内容提要

关键要点

标签

继续阅读