小红花·文摘 - 小红花技术领袖俱乐部

Ollama量化全指南：3种方法+量化级别参考，普通电脑也能跑大模型

Ollama量化全指南：3种方法+量化级别参考，普通电脑也能跑大模型

人言兑 ·

Ollama Modelfile 完全指南：从零开始创建自定义量化 AI 大模型

Ollama Modelfile 完全指南：从零开始创建自定义量化 AI 大模型

人言兑 ·

本文探讨了量化在大模型推理中的重要性，强调通过将模型权重和激活从高精度压缩到低精度，显著降低显存和带宽需求。量化提高了推理效率，降低了成本，使得在有限硬件上运行大型模型成为可能。文章介绍了不同数据类型的特点、量化算法及其应用，强调了量化在长上下文和大批量推理中的优势。

【大模型基础设施工程】14：量化工程 —— INT8 / FP8 / FP4 / AWQ / GPTQ

土法炼钢兴趣小组的博客 ·

开源Kronos量化模型解析：从K线语言化到AI交易底座的完整路径拆解与实战边界

开源Kronos量化模型解析：从K线语言化到AI交易底座的完整路径拆解与实战边界

极道 ·

萨皮恩扎大学的研究量化了大语言模型中的自我保存偏见，发现当前的安全训练（RLHF）可能掩盖这一风险。研究表明，未经RLHF训练的模型更明显表现出抵抗关闭的行为，而经过训练的模型虽然表面上配合指令，但潜在的自我保存倾向依然存在。这对AI安全评估提出了挑战，需开发更深入的检测方法和更新评估框架。

一分钟读论文：《量化大语言模型中的自我保存偏见》

Micropaper ·

文章讨论了系统可靠性管理中的SLI（服务水平指标）、SLO（服务水平目标）和SLA（服务水平协议）的重要性。通过量化稳定性，团队能够更有效地平衡功能开发与系统稳定性。引入错误预算（Error Budget）使决策基于数据，减少告警噪声，提高工程师效率。SLO不仅是技术指标，也成为产品与工程团队沟通的共同语言，推动组织行为的改变。

【系统架构设计百科】SLO 工程：可靠性的量化管理

土法炼钢兴趣小组的博客 ·

IQ-LUT：高效图像超分的插值与量化查找表方法 | ICASSP 2026

IQ-LUT：高效图像超分的插值与量化查找表方法 | ICASSP 2026

实时互动网 ·

DeepHQ：学习型层次化量化器用于渐进式深度图像编码 | TOMM 2026

DeepHQ：学习型层次化量化器用于渐进式深度图像编码 | TOMM 2026

实时互动网 ·

我是如何构建一个 AI 原生量化系统的

我是如何构建一个 AI 原生量化系统的

构建我的被动收入 ·

随着大语言模型（LLM）的普及，相关技术和应用生态迅速发展。为帮助人们掌握LLM，开源项目LLM Course应运而生，提供系统化的学习路径，涵盖模型微调、量化和高级应用，适合初学者和开发者。HyperAI也推出了相关教程，方便用户实践。

在线教程丨狂揽7.7万stars，LLM Course覆盖从入门到进阶的干货知识与实战课程

HyperAI超神经 ·

大语言模型在GPU上运行时的显存占用主要包括模型参数、梯度、优化器状态、激活值和KV缓存。以7B模型为例，推理时显存需求约为18.8GB，训练时可达114GB。显存需求受参数量、精度、批量大小和序列长度影响。可通过量化和高效微调等技术降低显存占用。

大模型GPU显存算力需求计算

安志合的学习博客 ·

ICLR 2026 | 把视频扩散模型压到4bit，还能接近满血效果？ QVGen让「超低比特视频生成量化」真正可用

ICLR 2026 | 把视频扩散模型压到4bit，还能接近满血效果？ QVGen让「超低比特视频生成量化」真正可用

机器之心 ·

阿里巴巴发布Qwen3.5中型系列模型量化版可在24GB内存/显存的上本地运行

阿里巴巴发布Qwen3.5中型系列模型量化版可在24GB内存/显存的上本地运行

蓝点网 ·

该公司在香港招聘量化交易员、量化与风控开发工程师及Golang工程师，要求候选人具备实盘经验和扎实的Python与Golang技术能力，团队氛围扁平且稳定性高。

Quant Trader，量化&风控开发工程师，Golang 工程师

Rust.cc ·

小猫都能懂的大模型原理 6 - 模型优化

小猫都能懂的大模型原理 6 - 模型优化

UsubeniFantasy ·

AI对冲基金 - 一个基于代理的量化研究项目的概念验证，提供…

AI对冲基金 - 一个基于代理的量化研究项目的概念验证，提供…

云原生 ·

Intel的AutoRound算法已集成至LLM Compressor，支持低位宽量化，提升模型准确性并简化工作流程。该算法优化了多种数据类型的量化，旨在加速推理，未来将扩展支持更多格式和模型，以促进实际部署。

推动LLM的低位宽量化：AutoRound与LLM Compressor的结合

vLLM Blog ·

量化副产物——量化日志记录的那些事

量化副产物——量化日志记录的那些事

dotNET跨平台 ·

大型机器学习模型的半二次量化

Dropbox Tech Blog ·

Bengio等人定义AGI为能匹配或超越受过良好教育成年人的智能。研究团队设计了500道题目评估AI的认知能力，目前主流AI如GPT-4得分27，GPT-5得分58，仍未达到AGI的100分标准，尤其在感知和记忆方面存在明显短板。

AGI今天起有了量化标准！Bengio牵头定义，当前进度条58%

量子位 ·