小红花·文摘 - 小红花技术领袖俱乐部

今晚19点，KTransformers项目将直播，介绍如何在本地使用2GPU+2CPU微调超大模型。清华大学的章明星教授和李沛霖将分享低成本LoRA微调技术及项目进展，欢迎预约观看。

今晚19点｜2GPU+2CPU微调超大模型，带你上手开源KTransformers

量子位 ·

KTransformers是趋境科技与清华大学联合研发的高性能异构推理框架，专注于大模型推理。该框架通过CPU与GPU协同优化算力利用，提升推理效率，支持低算力环境下的大模型应用。其论文入选国际顶会SOSP 2025，获得全球认可，并与主流框架SGLang合作，推动开发者创新。

KTransformers入选计算机系统顶会、与主流框架合作，趋境&清华让「异构」成为推理新范式

量子位 ·

KTransformers 一个新型的Transformers框架能够有效提高LLM的推理速度

KTransformers 一个新型的Transformers框架能够有效提高LLM的推理速度

编译程序 ·