量子位 ·

2张4090竟能本地微调万亿参数Kimi K2！趋境联合清华北航把算力门槛击穿了

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

趋境科技与清华北航联合推出KTransformers和LLaMA-Factory，使得仅需2-4张4090显卡即可微调超大模型Kimi K2和DeepSeek 671B，显存需求显著降低，推动AI个性化定制与应用创新。

🎯

❓

KTransformers用于超大模型的微调，显存需求显著降低；LLaMA-Factory是一个易用的大语言模型训练与微调平台，用户无需编写代码即可完成微调。

微调Kimi K2模型大约需要90G的显存。

使用KTransformers微调模型的成本显著降低，传统方法需要高达2000GB显存，而现在仅需2-4张4090显卡。

KTransformers在超大规模MoE模型上提供了唯一可行的方案，并在较小规模模型上展现了更高的吞吐和更低的显存占用。

微调后的模型在生成文本时表现出更具个性化的风格，能够根据特定的语气或风格进行调整。

用户只需安装KTransformers和LLaMA-Factory环境，设置相关参数后即可快速启动微调。

🏷️

有人靠CPU把AI算力密度卷到了新高度
英特尔推出新技术以应对Agentic AI的算力焦虑，提升AI算力密度，推动数据中心和AI的发展。
智源&清华合作成果登上Science：脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
研究表明，睡眠中的记忆重激活影响睡眠动态，提供了“记忆-睡眠”双向作用的新证据。智源研究院与清华大学的研究发现，负向记忆再激活加剧睡眠碎片化，而正向记忆再...
Winxvideo AI 二十周年限免：视频压缩、本地AI提升画质、防抖
Winxvideo AI 正在进行二十周年限免活动，用户只需提供邮箱即可获取注册码。该软件集视频增强、图片修复、格式转换等功能于一体，支持超分辨率提升、帧...
知识图谱+本地存储：开源Mnemo给AI配的长期记忆中枢
Mnemo是为大语言模型设计的本地优先长期记忆层，旨在解决AI每次会话忘记上下文的问题。它通过构建知识图谱存储历史对话和信息，帮助AI在后续提问中自动召回...
Gemma 4 QAT models: Optimizing model compression for mobile and laptop efficiency
Gemma 4 Quantization-Aware Training (QAT)
我们在2026年5月发布的最新AI新闻
谷歌在2026年5月推出了多个AI相关产品，包括Gemini 3.5和Gemini Omni，旨在提升日常生活便利性。新应用Google Health和F...