小红花·文摘 - 小红花技术领袖俱乐部

研究团队首次系统评估了Qwen3在低比特量化下的鲁棒性，发现其在8比特时性能接近无损，但在4比特及以下时显著下降，尤其在复杂任务中。Qwen3的预训练使其对量化敏感，需要创新量化技术以保持性能。

首次系统评估Qwen3在量化下的鲁棒性：8bit下仍保持近乎无损性能

量子位 ·

本研究探讨了大语言模型在数学推理中的低比特量化影响，并提出了多维评估框架。结果表明，量化对数字计算和推理规划能力的影响存在差异，并识别出性能下降的关键领域。

The Convergence of Quantization and Reasoning: Exploring the Impact of Low-Bit Quantization on Mathematical Reasoning in Large Language Models

BriefGPT - AI 论文速递 ·

低精度只适用于未充分训练的LLM？腾讯提出LLM量化的scaling laws

低精度只适用于未充分训练的LLM？腾讯提出LLM量化的scaling laws

机器之心 ·

研究表明，低比特量化对未充分训练的大型语言模型有利，且量化导致的性能下降较小。提出通过量化降级评估模型训练水平，强调未来低比特量化的性能可能不理想。

低比特量化有利于未充分训练的大型语言模型：量化大型语言模型的扩展法则，训练令牌数达到100T

BriefGPT - AI 论文速递 ·

本研究提出了一种名为“量化提示”（P4Q）的方法，旨在减少大规模视觉语言模型对训练样本和计算资源的需求。P4Q通过轻量架构和对比损失监督，提升了低比特量化模型的识别性能，缩小了图像和文本特征之间的差距。实验结果显示，P4Q性能优于现有技术，具有实际应用潜力。

P4Q：学习为视觉语言模型量化提供提示

BriefGPT - AI 论文速递 ·