小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

机器之心数据服务现已上线,提供高效稳定的数据获取,简化爬取流程。

DeepSeek刚提到FP8,英伟达就把FP4精度推向预训练,更快、更便宜

机器之心
机器之心 · 2025-08-27T12:52:49Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

机器之心
机器之心 · 2025-06-18T10:00:48Z

本研究提出了一种混合精度策略,用于量化FP4精度的训练方法,旨在解决大型语言模型训练中的计算需求问题。实验结果表明,该策略在降低计算成本的同时,能够达到与BF16和FP8相当的准确性。

朝向高效预训练:探索大型语言模型中的FP4精度

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

微软推出FP4训练框架,能在相同超参数下实现与BF16相当的训练效果,降低存储和计算资源需求。该框架支持最大130亿参数的模型,采用FP8模拟FP4,提升训练效率,并在反向传播中引入可微分梯度估计方法,确保训练稳定性。

大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当

量子位
量子位 · 2025-01-30T04:50:30Z

英伟达发布的迷你超算Project DIGITS引发争议,专家批评其FP4算力宣传不实,认为性能与250美元显卡相当。Tiny Corp指责其售价3000美元的超算不如游戏电脑,强调FP4无法实际使用。尽管如此,英伟达仍计划进军消费级CPU市场。

英伟达迷你超算遭友商嘲讽:宣传FP4算力,实际“不如买个游戏电脑”

量子位
量子位 · 2025-01-10T08:34:15Z

Diffusion Transformers (DiTs) are improved by Hybrid Floating-point Quantization (HQ-DiT), a post-training quantization method utilizing 4-bit floating-point precision on both weights and...

高效的 FP4 混合量化扩散变换器(HQ-DiT)

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-30T00:00:00Z

研究发现,使用浮点量化可以在大型语言模型中获得出色的性能,尤其是使用FP8和FP4浮点数。对于权重量化,FP4与INT4相比表现出可比、甚至更好的性能。研究提出了两个权重量化的缩放约束条件,对性能的影响微乎其微,同时结合了低秩补偿策略来增强量化方法,特别适用于较小的模型。这些结果为在资源受限环境中高效部署大型语言模型铺平了道路。

了解后训练量化对大规模语言模型的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码