Apple Machine Learning Research ·

重新审视大语言模型训练中下游指标的扩展特性

💡 原文英文，约200词，阅读约需1分钟。

📝

内容提要

本文提出了一种直接框架，用于扩展大语言模型（LLM）的基准性能，发现固定的令牌与参数比率下，简单的幂律能够准确描述多个下游任务的准确率扩展行为。研究表明，该方法优于传统的两阶段程序，并能有效预测准确率。

🎯

❓

本文提出了一种直接框架，用于扩展大语言模型（LLM）的基准性能。

研究发现，在固定的令牌与参数比率下，简单的幂律能够准确描述多个下游任务的准确率扩展行为。

该方法优于传统的两阶段程序，能够有效预测准确率，减少复合误差。

本文引入了功能形式，能够预测不同令牌与参数比率下的准确率，并考虑重复采样下的推理计算。

研究验证了在最多17B参数和350B令牌的模型上，结果支持可重复性并鼓励未来研究。

研究结果支持可重复性，并鼓励未来研究，特别是在大语言模型的基准性能扩展方面。

🏷️

告别手腕上的束缚！这款这无感监测垫让我实现“裸睡级”睡眠追踪
熊猫发现Withings Sleep睡眠监测垫，解决了传统穿戴设备的不便。该垫通过气动传感器监测睡眠，准确率达94.4%，使用简单，无需佩戴和充电，提供全...
Khronos 在 OpenXR 扩展矩阵中新增了中间件相关信息
Khronos扩展了OpenXR扩展矩阵，纳入了中间件供应商数据，帮助开发者了解XR应用程序的扩展支持。目前矩阵包含Godot、Unity等五款中间件，未...
AWS希望注册您的AI代理
这个新注册表是AWS AgentCore的一部分，旨在构建和部署代理，提供额外功能，并支持来自其他提供商的代理索引。
Fitbit个人健康教练扩展至37个国家和32种语言。
Fitbit个人健康教练的公共预览体验正在全球扩展，支持更多国家和语言，包括繁体中文。用户将在未来几周内更新应用，新增VO2Max功能。
《恶魔城》领衔一系列令人兴奋的独立游戏揭晓
第三届Triple-I展会展示了多款独立游戏，包括Konami开发的《恶魔城：贝尔蒙特的诅咒》和新作《不要饿死：别处》，以及《证明你是人类》、《永不回头》...
云原生开源世界中AI合规性的下一阶段
在阿姆斯特丹的KubeCon + CloudNativeCon上，我与CNCF执行董事Jonathan Bryce讨论了AI合规性计划如何通过提升可移植性...