机器之心 ·

百万美金炼出「调参秘籍」！阶跃星辰开源LLM最优超参工具

💡 原文中文，约6900字，阅读约需17分钟。

📝

内容提要

阶跃星辰研究团队训练了3700个大语言模型，发现超参数优化的新规律（Step Law），并开源相关工具和数据。研究表明，最优学习率和批量大小与模型和数据规模呈幂律关系，适用性广泛。

🎯

❓

阶跃星辰研究团队发现的超参数优化新规律称为Step Law，表明最优学习率和批量大小与模型和数据规模呈幂律关系。

研究团队训练了3700个大语言模型。

Step Law的鲁棒性增强了工具的实用性和普适性，使其在不同模型和数据条件下依然有效。

研究发现超参数优化的Landscape呈现明显的凸性特征，存在稳定的最优超参数区域。

推出的超参数估算工具与穷举搜索的全局最优超参数相比，性能差距仅为0.09%。

研究揭示了学习率调度策略对最优超参数选择的显著影响，固定最小学习率策略更具实际应用价值。

🏷️

69个开源AI工具大盘点2026年4月版 - 省下每年5万美金订阅费的开源方案
2026年4月，推荐了69个开源AI工具，包括Ollama、vLLM、LM Studio等，适用于本地运行大模型和推理引擎，帮助用户每年节省高达5万美元的...
Meta正在为其AI工具投放快速致富广告
Meta收购的AI公司Manus正在推广其工具，声称可以帮助用户轻松赚取收入。该公司通过支付内容创作者在社交媒体上宣传其产品，鼓励用户利用AI为本地企业建...
Meta公司放弃开源Llama，转向专有的Muse Spark
Meta公司宣布其新AI模型Muse Spark将取代已被放弃的Llama。Muse Spark采用全新架构，无法与Llama迁移，Llama用户需寻找替...
Quickbase的Pave工具瞄准了vibe coding著名的80%问题
文章讨论了“vibe coding”的挑战，特别是从原型到生产应用的转变。Neha Vyas指出，完成80%后，剩余20%往往需要更多时间和精力。Quic...
扬·维雷梅维奇：开源不会消亡，它只是缺乏资金支持。
开源软件不会消亡，但面临资金不足的问题。许多项目因缺乏资金支持而停滞，开发者需要寻找可持续的商业模式，以确保开源项目的长期发展。
TestMu AI推出全新浏览器自动化工具Kane CLI
TestMu AI推出了全新的浏览器自动化工具Kane CLI，旨在帮助开发者和测试工程师在终端中验证功能可用性。Kane CLI支持多种运行模式，具备意...