小红花·文摘

大模型量化训练极限在哪？腾讯混元提出低比特浮点数训练Scaling Laws

机器之心 ·

DeepSeek-R1-Lite模型在数学推理任务中表现优异，超越了OpenAI的o1-preview，但在编码和复杂知识理解方面存在不足。该模型采用强化学习，遵循新的Scaling Laws，推理时间越长，表现越好。期待未来的开源版本和API。

DeepSeek版o1炸场，数学代码超越OpenAI，每天免费玩50次，后续将开源

量子位 ·

OpenAI 最新产品全曝光！奥特曼驳斥 AI 发展撞墙，Ilya 认错，秘密寻找下一个重大突破

爱范儿 ·

研究表明，训练的token数量越多，所需的精度越高，低精度量化可能失效。提出了“精度感知”Scaling Laws，强调在大规模模型的预训练和推理中需关注精度与性能的平衡。

今日最热论文：Scaling Law终结，量化也不管用，AI大佬齐刷刷附议

量子位 ·

OpenAI的Scaling Laws被视为大语言模型的摩尔定律。清华大学博士指出，为了提升模型性能，需要增加数据量至少10个数量级。华盛顿大学等机构提出了实验测试平台DCLM，通过固定训练代码，鼓励研究人员提出新的训练集来进行创新。DCLM-BASELINE是一个高质量训练集，通过基于模型的过滤达到了64%的准确性。DCLM提供了新的思考范式和可能性。

斯坦福/苹果等23所机构发布DCLM基准测试，高质量数据集能否撼动Scaling Laws？基础模型与Llama3 8B表现相当

HyperAI超神经 ·

GitHub 8k Star，一作实习生，字节这个大模型成果被苹果选中了

机器之心 ·