小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
最佳数据混合的缩放法则

本文提出了一种系统方法,通过缩放法则确定目标领域的最佳数据混合比例,以提升大规模模型的性能。该方法能够准确预测模型在特定领域权重下的损失,并在大型语言模型、多模态模型和视觉模型的预训练中验证其有效性。通过少量小规模训练,能够估计参数并推断更大规模的性能,提供了一种替代昂贵试错方法的方案。

最佳数据混合的缩放法则

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-26T00:00:00Z
如何建立人工智能缩放法则以实现高效的大型语言模型训练和预算最大化

研究人员在构建大型语言模型时,需要在计算和财务预算内优化性能。麻省理工学院与IBM研究所的团队收集了数百个模型及其性能指标,制定了选择小模型和估算缩放法则的指南,以提高预算使用效率。这些法则帮助研究人员预测大型模型的表现,促进了资源有限的研究者的理解与应用。

如何建立人工智能缩放法则以实现高效的大型语言模型训练和预算最大化

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-09-16T15:00:00Z
MTGR:美团外卖生成式推荐Scaling Law落地实践

深度学习中的缩放法则探讨了模型性能、架构与计算量的关系。生成式推荐(如MTGR)通过优化用户行为建模,提升了美团外卖的推荐效果,离线CTCVR GAUC提升2.88个百分点,订单量增加1.22%。该方法在资源使用上与基准模型相当,在线推理节省12%。未来将继续优化模型,以提升推荐效果。

MTGR:美团外卖生成式推荐Scaling Law落地实践

美团技术团队
美团技术团队 · 2025-05-19T00:00:00Z

本研究探讨了神经网络缩放法则在大型AI模型设计中的应用,指出现有策略的局限性,并提出适应性缩放策略,强调数据效率和架构约束的重要性,为模型优化提供理论支持。

How to Utilize Scaling Laws to Upscale Neural Networks? A Survey and Practical Guidelines

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本文探讨了LoRA微调中性能、参数与数据复杂性之间的关系,提出了一种基于互信息上界的内部度量,能够更准确地捕捉新旧知识的依赖关系。实验结果表明,该方法在评估LoRA微调的缩放法则上优于传统方法。

LoRA Scaling Laws Based on Mutual Information Upper Bound

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-06T00:00:00Z
低精度只适用于未充分训练的LLM?腾讯提出LLM量化的scaling laws

机器之心AIxiv专栏报道了腾讯AI Lab的研究,探讨低比特量化对未充分训练的大语言模型(LLM)的影响。研究表明,低比特量化在未充分训练的LLM上效果良好,但在充分训练后性能显著下降。研究人员提出了一套低比特量化的缩放法则,预测不同训练规模下模型的性能变化,强调充分训练的重要性。

低精度只适用于未充分训练的LLM?腾讯提出LLM量化的scaling laws

机器之心
机器之心 · 2024-12-29T07:29:33Z

山姆·奥特曼在斯坦福大学演讲中提到了人工智能的快速发展和GPT4的标杆地位,以及即将发布的GPT5和缩放法则的重要性。他认为免费、无广告的GPT是更好的途径。他还讨论了创新、创业和人与人工智能的关系。他强调了社会需要为技术进步做好准备,并表示人类总会有更大的创新。

Sam Altman在斯坦福大学的全面演讲解析:详细探讨GPT4设定的AI新标准和对GPT5的期待,以及人工智能的未来社会影响和商业模式变革

硕鼠的博客站
硕鼠的博客站 · 2024-04-29T00:35:39Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码