小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

vLLM 是一款加速大语言模型推理的框架,解决了内存管理瓶颈,实现了几乎零浪费的 KV 缓存。该框架支持 CPU 卸载和 LMCache,并提供示例代码和配置说明,方便用户进行实验和开发。

【vLLM 学习】Cpu Offload Lmcache

HyperAI超神经
HyperAI超神经 · 2025-06-06T12:25:28Z

Offload 是一款 JavaScript SDK,可以在用户浏览器本地运行 AI,保护数据隐私,降低成本,提高扩展性。它根据设备资源选择模型,资源不足时回退到指定 API。用户数据无需传输至第三方,适合处理敏感数据的行业,如医疗和法律。支持文本生成和 JSON 数据,强调本地 AI 重要性,避免数据泄露。

Offload - 一款统一的 JavaScript SDK,实现浏览器内的 AI

DEV Community
DEV Community · 2024-10-08T10:29:20Z

Offload项目将处理过程转移到用户设备上,提高数据隐私性并降低推理成本。通过在用户设备上直接运行模型,解决了成本和用户数据隐私的问题。用户可以在Offload网站上了解更多信息。

将AI推理卸载到用户设备

DEV Community
DEV Community · 2024-09-12T17:32:18Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码