小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了SMI指标，解决了封闭书籍问答任务中大型语言模型表现的预测问题，强调了数据构建和知识保持的挑战。实验证明SMI与模型准确性之间存在强线性相关性，为资源优化和数据对齐提供了重要见解。

Predicting the Performance of Large Language Models on Closed Book Question Answering Tasks Using Pre-training Available Information

BriefGPT - AI 论文速递 ·

该研究发现数据量和参数规模对模型性能有影响，人工指导的数据比合成数据更有效，指令数据具有跨能力泛化性。这些发现可指导更高效的数据构建，提升实际性能。

指导调优的动力学：大型语言模型中的每个能力都有自己的增长速度

BriefGPT - AI 论文速递 ·