小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

面壁智能推出的BitCPM-CANN三值大模型显著降低显存需求,最高可节省6倍,同时保留97%的模型能力。该模型首次在华为昇腾平台上完成训练,支持多种应用场景,从手机到PC。通过三值量化技术,模型在保持性能的同时显著减少内存占用,为AI在终端设备的应用提供了新可能。

将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

爱范儿
爱范儿 · 2026-05-25T04:05:47Z
FLUX.2‑klein‑4B:步数蒸馏实现 4 步亚秒级图像生成,在消费级 GPU 上体验实时交互;Vehicles OpenImages 数据集:专注车辆检测与定位

黑森林实验室发布的FLUX.2-klein-4B模型,通过步数蒸馏实现亚秒级推理,显存需求仅13GB,支持多种生成模式,提升了AI图像生成的实时交互能力。

FLUX.2‑klein‑4B:步数蒸馏实现 4 步亚秒级图像生成,在消费级 GPU 上体验实时交互;Vehicles OpenImages 数据集:专注车辆检测与定位

HyperAI超神经
HyperAI超神经 · 2026-02-02T08:33:47Z

趋境科技与清华北航联合推出KTransformers和LLaMA-Factory,使得仅需2-4张4090显卡即可微调超大模型Kimi K2和DeepSeek 671B,显存需求显著降低,推动AI个性化定制与应用创新。

2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了

量子位
量子位 · 2025-11-05T07:58:55Z
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

RTX 3080移动版可用于GRPO训练大型语言模型。GRPO是一种在线学习算法,通过生成的数据进行迭代改进。文章讨论了模型大小选择、显存需求及优化技术,如8-bit优化和梯度检查点,以降低内存占用。实验表明,内存需求随模型大小和训练方式变化,完全微调比PEFT需更多内存。作者使用trl库进行训练,展示了GRPO的潜力和应用。

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

机器之心
机器之心 · 2025-02-07T05:48:08Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码