小红花·文摘 - 小红花技术领袖俱乐部

麦角硫因降低NAD+消耗改善睡眠节律稳定性

麦角硫因降低NAD+消耗改善睡眠节律稳定性

极道 ·

Codex经历用量消耗过快问题后现在实际能使用的配额似乎大幅度增加($112-->$191)

Codex经历用量消耗过快问题后现在实际能使用的配额似乎大幅度增加($112-->$191)

蓝点网 ·

Codex团队正在彻查目前使用配额消耗过快问题修复后将为用户提供更多重置次数

Codex团队正在彻查目前使用配额消耗过快问题修复后将为用户提供更多重置次数

蓝点网 ·

如何优化语音通话API的带宽消耗？

如何优化语音通话API的带宽消耗？

实时互动网 ·

AI 范式雷达：《Agent的Token账单：1000倍消耗差异背后的工程真相》

AI 范式雷达：《Agent的Token账单：1000倍消耗差异背后的工程真相》

Micropaper ·

7 个实用技巧，让Claude Code的Token消耗爆降80%

7 个实用技巧，让Claude Code的Token消耗爆降80%

程序新视界 ·

腾讯开源 Agent 记忆技术方案，Token 消耗最高降低 61%

量子位 ·

文章探讨了大模型的使用成本，特别是输入、输出和缓存的费用。模型越大，能力越强，价格越高。推理过程分为预填充和解码，前者并行处理，后者逐个生成，导致计算量非线性增长。通过缓存技术可以降低重复计算成本，有效的上下文管理和明确的需求描述有助于节省Token，提升使用效率。

LLM Token 消耗节省计划

范叶亮的博客 ·

OpenAI 发布了 GPT-5.5 模型，API 价格较 GPT-5.4 翻倍，引发开发者不满。萨姆·奥尔特曼表示，尽管价格上涨，但实际 tokens 消耗更低，推理能力更强，能减少重复调用，降低成本。GPT-5.5 更适合自动化和复杂任务，而简单任务仍建议使用旧模型。开发者需根据需求选择合适模型。

GPT 5.5 API价格上涨100%引起众多吐槽萨姆称价格上涨但实际消耗明显降低

蓝点网 ·

Claude Opus 4.7新模型发布：用户吐槽性能缩水与算力消耗暴涨

Claude Opus 4.7新模型发布：用户吐槽性能缩水与算力消耗暴涨

极道 ·

Anthropic 承认 Claude Code 在工作日高峰期配额消耗加快，约 7% 的用户会更快触发限制。自 3 月 23 日起，用户反映配额消耗过快，影响任务执行时间。公司未提前通知调整，建议开发者在非高峰期执行大任务。

Claude Code配额消耗速度比以前更快？A社承认已经调整配额分配方式

蓝点网 ·

参议员们正在推动了解数据中心实际使用的电力消耗

参议员们正在推动了解数据中心实际使用的电力消耗

The Verge ·

新的令牌对象表示法（TOON）希望通过减少令牌消耗来降低大型语言模型（LLM）的成本

新的令牌对象表示法（TOON）希望通过减少令牌消耗来降低大型语言模型（LLM）的成本

InfoQ ·

加速大语言模型推理：降低资源消耗的高效 KV 缓存系统 | 开源日报 No.706

加速大语言模型推理：降低资源消耗的高效 KV 缓存系统 | 开源日报 No.706

开源服务指南 ·

人工智能模型的能源和水资源消耗上升及其减少方法

人工智能模型的能源和水资源消耗上升及其减少方法

InfoQ ·

空结构体在Go语言中不占用内存，适合用于高效的数据结构和并发模式。可用于实现集合、信号通知和无状态方法，合理使用可降低内存占用，提高性能。

Go语言空结构体：零内存消耗的高效编程

郑文峰的博客 ·

苹果手表卡路里消耗误差高达28%；特朗普将第三次给予TikTok宽限期；周鸿祎称准备干掉360整个市场部

苹果手表卡路里消耗误差高达28%；特朗普将第三次给予TikTok宽限期；周鸿祎称准备干掉360整个市场部

全球TMT-美通国际 ·

到2025年底，人工智能的电力消耗可能超过比特币

到2025年底，人工智能的电力消耗可能超过比特币

The Verge ·

阿里通义推出PARSCALE新策略，使1.6B模型性能接近4.4B，内存占用仅为1/22，延迟增加1/6。该方法通过并行计算和动态聚合权重，显著提升模型能力，训练成本降低98%。

阿里通义发布并行计算新策略：1.6B等效4.4B，内存消耗骤降95%

量子位 ·

从概念到代码：打造智能卡路里消耗追踪器

从概念到代码：打造智能卡路里消耗追踪器

DEV Community ·