小红花·文摘

计算最优的量化感知训练

Apple Machine Learning Research ·

一台3090就能跑Gemma 3 27B！谷歌发布Gemma 3全系QAT版模型

机器之心 ·

本研究提出了一种量化感知训练管道，以解决MedSAM模型在医学图像分割中对计算资源的高需求问题。该方法通过OpenVINO推理引擎进行部署，实验结果表明在提高处理速度的同时保持了可接受的准确性，具有重要的临床应用潜力。

Efficient Quantization-Aware Training and Deployment of the Segmentation Anything Model in Medical Images

BriefGPT - AI 论文速递 ·

量化感知训练在小型语言和视觉模型中表现优异，证明了其在小型深度学习网络中的可行性，推动了低资源环境下的模型应用与研究。

BitNet a4.8：1位大型语言模型的4位激活

BriefGPT - AI 论文速递 ·

在工业4.0中，深度学习和智能制造促进了高效视觉检测系统的发展。研究显示，多类模型在MVTec AD数据集上的表现与单类模型相当，无需为每个类别单独建模。在CPU和NVIDIA Jetson Xavier NX上测试了多类异常检测模型的延迟和内存需求。比较量化感知训练（QAT）和后训练量化（PTQ）的性能，发现QAT在无监督任务中更接近原始32位浮点数。

XAI引导的不平衡数据集绝缘体异常检测

BriefGPT - AI 论文速递 ·

本研究提出了一种新的自适应量化方案，应用于时间序列Transformer模型上的量化感知训练（QAT），实验证明该方法可以减少计算开销同时保持可接受的精度，表现出鲁棒性，为模型量化和部署决策提供指导并奠定了量化技术发展的基础。

量化感知训练的转换率调度

BriefGPT - AI 论文速递 ·

本文介绍了一种通过权重剪枝和模型蒸馏技术训练稀疏的预训练变压器语言模型，并使用量化感知训练将这些模型压缩为8位精度的新方法。实验证明，该方法在多种自然语言任务中传输知识，并且是目前最好的压缩BERT模型的方法。

LLM 外科医生

BriefGPT - AI 论文速递 ·