Hugging Face - Blog ·

使用bitsandbytes、4位量化和QLoRA提高LLM的可访问性

💡 原文英文，约2900词，阅读约需11分钟。

📝

内容提要

本文介绍了Bitsandbytes和QLoRA两种方法，可以将模型压缩到4位精度，适用于大多数HF模型。虽然无法进行纯4位训练，但可以使用参数高效微调方法（PEFT）在模型上进行微调。作者还介绍了这种量化方法对消费级硬件上训练大型模型的影响，并提供了相关实验结果。

🎯

🏷️

性和浪漫爱情可以都是崇高的
文章探讨了性与浪漫爱情的二元对立，指出这种观念导致性压抑和内心冲突，尤其是女性在享受性愉悦时常感到恐惧和焦虑。尽管性与浪漫爱情在生理上并无高低之分，但文化...
Cloudflare观测数据显示全网机器人流量已经超过真实人类产生的访问
Cloudflare数据显示，机器人流量已超过真实人类流量，达到57.5%。这一增长与AI智能体的快速采用密切相关。尽管机器人流量在HTTP请求中占比更高...
身份与访问管理白皮书
随着云原生架构的分布式和自动化，身份管理成为新的安全边界。传统身份验证方法难以满足短暂工作负载和零信任要求。IAM白皮书为架构师和开发者提供了在云原生环境...
我们在2026年5月发布的最新AI新闻
May AI recap
How OpenAI Built a Secure Windows Sandbox for Codex Agents
OpenAI details Codex Windows sandbox architecture, showing how SIDs, ACLs, re...
MAHA希望将棉花打造成新的牛脂
美国农业部推出“伟大的美国棉花计划”，旨在推广本土棉花，支持农民和国内制造业。尽管消费者对天然纤维服装的兴趣上升，但棉花生产面临高成本和化学品使用问题，且...