量子位 ·

小模型越级挑战14倍参数大模型，谷歌开启Test-Time端新的Scaling Law

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

谷歌DeepMind的最新研究发现，计算优化方法比扩展模型参数更经济有效。研究团队探究了基于过程的密集验证器奖励模型和根据prompt自适应更新模型的响应分布。团队提出了“计算最优”扩展策略，能够在使用少4倍测试计算资源的情况下超越其他方法。

🎯

关键要点

谷歌DeepMind的研究表明，计算优化方法比扩展模型参数更经济有效。
小模型在相同计算资源下性能超过14倍参数的大模型。
研究团队探讨了动态分配测试时计算资源的方法。
推理阶段使用额外计算可以改善输出效果。
研究提出了'计算最优'扩展策略，根据prompt难度自适应分配计算资源。
团队将问题分为五个难度等级，为每个等级选择最佳策略。
计算最优扩展在使用少4倍测试计算资源的情况下超越best-of-N方法。
在难度较大的问题上，增加预训练计算更为有效。
研究引发网友热议，猜测OpenAI新模型草莓可能采用类似方法。

🏷️

继续阅读

大模型 Temperature 与 Top_p/Top_k 参数详解
本文讨论了大模型输出的两个重要超参数：温度（Temperature）和核采样（Top-p）。温度控制输出的随机性，低温度使输出更确定，高温度增加多样性。核...
【开源许可与版权工程】开源世界全景：从 GNU 到大模型的四十年
文章探讨了自由软件、开源、Source Available和专有软件之间的关系，分析了开源协议的演变及其对商业的影响，特别关注2018年后开源协议的变化，...
Ads Advisor提升谷歌广告安全性和效率的三种新方式
谷歌广告的Ads Advisor推出三项新功能：实时政策审查、24/7安全监控和即时认证，旨在提升广告管理效率，帮助企业更安全、高效地创新。
谷歌将Pomelli以英语推向欧洲的小型企业。
谷歌推出了Pomelli，这是一个AI驱动的营销工具，旨在帮助小型企业轻松生成品牌内容，如产品图片和社交媒体活动。该工具通过三步了解企业并创建定制内容，提...
大华股份携AI大模型与物联技术参加中国林业大会
大华股份在第七届中国林业大会上展示了AI大模型和物联技术，重点关注林草生态感知、森林防火和生物多样性监测。公司分享了火情误报分析、动物视图与声纹识别等创新...
勒索软件谈判专家帮助黑客索要更高赎金甚至还亲自下场部署勒索软件来勒索赎金
#安全资讯勒索软件谈判专家收取黑客贿赂帮助黑客索要更高的赎金，甚至对贿赂还不满足，直接下场参与部署勒索软件。美国事件响应公司 DigitalMint 的...

小模型越级挑战14倍参数大模型，谷歌开启Test-Time端新的Scaling Law

内容提要

关键要点

标签

继续阅读