plus studio ·

speculative-sampling笔记

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

speculative-sampling是一种加速llm推理的方法，使用了小模型和大模型。它通过自回归采样预测下一个token，并使用拒绝采样公式进行采样。该方法可以与其他方法结合使用，并选择较小版本的目标语言模型作为草稿。

🎯

🏷️

用苹果 M5 Max 跑大模型真的省钱吗？有人算了一笔账
使用14寸MacBook Pro M5 Max（64GB内存）本地运行大模型的成本高于在线API。经过电费和硬件折旧计算，3年使用的总成本约为每小时$0....
SpaceX刚刚提交了可能成为史上最大IPO的申请
SpaceX正式向SEC提交S-1招股说明书，计划在纳斯达克上市，可能成为史上最大IPO。2025年，SpaceX收入预计达到186.7亿美元，主要来自S...
NanoCo押注企业AI的未来是为每位员工提供一个独立的沙箱代理
NanoCo, the Tel Aviv startup behind the open source NanoClaw agent framework,...
调查对GitHub内部仓库的未经授权访问
亚历克西斯·威尔斯是GitHub的首席信息安全官，负责保护平台和开源社区，支持全球超过1.5亿开发者安全构建软件。她在国防部和网络安全局有20年经验，致力...
‘你说要解决所有疾病？’
谷歌DeepMind首席执行官Demis Hassabis在Google I/O大会上表示，公司的目标是重新构想药物发现过程，以期解决所有疾病。他提到的G...
Christophe Pettus: All Your GUCs in a Row: check_function_bodies
PostgreSQL validates function bodies at creation time by default, catching sy...