小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

研究团队首次系统评估了Qwen3在低比特量化下的鲁棒性,发现其在8比特时性能接近无损,但在4比特及以下时显著下降,尤其在复杂任务中。Qwen3的预训练使其对量化敏感,需要创新量化技术以保持性能。

首次系统评估Qwen3在量化下的鲁棒性:8bit下仍保持近乎无损性能

量子位
量子位 · 2025-05-09T08:09:17Z

本研究探讨了大语言模型在数学推理中的低比特量化影响,并提出了多维评估框架。结果表明,量化对数字计算和推理规划能力的影响存在差异,并识别出性能下降的关键领域。

The Convergence of Quantization and Reasoning: Exploring the Impact of Low-Bit Quantization on Mathematical Reasoning in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-06T00:00:00Z
低精度只适用于未充分训练的LLM?腾讯提出LLM量化的scaling laws

机器之心AIxiv专栏报道了腾讯AI Lab的研究,探讨低比特量化对未充分训练的大语言模型(LLM)的影响。研究表明,低比特量化在未充分训练的LLM上效果良好,但在充分训练后性能显著下降。研究人员提出了一套低比特量化的缩放法则,预测不同训练规模下模型的性能变化,强调充分训练的重要性。

低精度只适用于未充分训练的LLM?腾讯提出LLM量化的scaling laws

机器之心
机器之心 · 2024-12-29T07:29:33Z

研究表明,低比特量化对未充分训练的大型语言模型有利,且量化导致的性能下降较小。提出通过量化降级评估模型训练水平,强调未来低比特量化的性能可能不理想。

低比特量化有利于未充分训练的大型语言模型:量化大型语言模型的扩展法则,训练令牌数达到100T

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

本研究提出了一种名为“量化提示”(P4Q)的方法,旨在减少大规模视觉语言模型对训练样本和计算资源的需求。P4Q通过轻量架构和对比损失监督,提升了低比特量化模型的识别性能,缩小了图像和文本特征之间的差距。实验结果显示,P4Q性能优于现有技术,具有实际应用潜力。

P4Q:学习为视觉语言模型量化提供提示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码