小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
将AI令牌使用量减少96%?AWS Strands Agents是如何做到的

AWS开发者倡导者摩根·威利斯讨论了Strands Agents的开源框架,该框架自发布以来已下载超过1400万次。她演示了如何通过意图驱动的工具将API调用从五次减少到一次,从而显著降低令牌使用量。威利斯强调,专用代理在任务精准性和效率上优于通用代理。

将AI令牌使用量减少96%?AWS Strands Agents是如何做到的

The New Stack
The New Stack · 2026-04-29T18:52:32Z
重新思考AI总拥有成本:为什么每个令牌的成本是唯一重要的指标

在AI基础设施评估中,成本每个令牌是关键指标。企业应关注令牌输出而非仅计算成本。NVIDIA的Blackwell平台在每瓦特令牌输出上优于Hopper,显著降低了成本。选择AI基础设施时,需重视实际输出和成本效率,以实现盈利和规模化。

重新思考AI总拥有成本:为什么每个令牌的成本是唯一重要的指标

NVIDIA Blog
NVIDIA Blog · 2026-04-15T15:00:26Z

Apache 服务器开发者因操作失误泄露 GitHub 令牌,GitHub 及时检测并吊销该令牌,通知开发者更换,从而降低安全风险。

Apache项目开发者提交代码时不慎泄露GitHub令牌 但并非AI造成的问题

蓝点网
蓝点网 · 2026-04-09T07:09:24Z
大型语言模型中的令牌化:每位人工智能应用开发者需要了解的内容

向大型语言模型(LLM)发送提示时,文本会被分割成令牌,这影响成本、响应速度和上下文容量。令牌化分为四个阶段,模型基于令牌处理文本。选择合适的令牌化方法(如子词令牌化)可提高效率,理解令牌化有助于优化应用性能和成本,管理上下文预算至关重要。

大型语言模型中的令牌化:每位人工智能应用开发者需要了解的内容

Redis Blog
Redis Blog · 2026-04-02T00:00:00Z
TTFT的含义:首次令牌时间对您的大型语言模型应用程序的启示

TTFT(首次令牌时间)是评估聊天机器人响应速度的重要指标,直接影响用户体验。它包括网络延迟、请求排队时间和模型处理时间。通过缓存、压缩提示和改进基础设施可以优化TTFT,从而提升用户满意度。

TTFT的含义:首次令牌时间对您的大型语言模型应用程序的启示

Redis Blog
Redis Blog · 2026-04-02T00:00:00Z
Portkey公司在每日处理两万亿个令牌后开源其AI网关

Portkey公司开源AI网关和MCP网关,旨在为企业提供治理、可观察性和成本控制,支持每日处理两万亿个令牌,帮助企业管理AI流量,避免预算超支和合规问题。Portkey强调基础设施应免费,智能代理是关键技术。

Portkey公司在每日处理两万亿个令牌后开源其AI网关

The New Stack
The New Stack · 2026-03-31T19:53:03Z
如何在FastAPI中实现令牌桶速率限制

本文介绍如何在FastAPI中实现Token Bucket算法来控制API请求速率,防止服务过载。内容包括创建速率限制中间件、用户跟踪和测试,最终实现可应用于任何FastAPI项目。

如何在FastAPI中实现令牌桶速率限制

freeCodeCamp.org
freeCodeCamp.org · 2026-03-27T21:36:52Z
认证令牌不是数据契约

认证令牌用于验证调用者的授权,不应依赖其内容,因其可能随时更改或不可读。今夏将进一步加密令牌,依赖解码令牌的应用将受到影响。应使用Azure DevOps REST API获取数据,令牌仅用于验证和授权。

认证令牌不是数据契约

Azure DevOps Blog
Azure DevOps Blog · 2026-03-18T18:46:49Z
3600亿个令牌,300万客户,6名工程师

Durable是一款AI商业构建平台,旨在简化创业流程,帮助企业主快速启动和优化业务。通过自动化网站、品牌和客户管理,Durable使创业者能够专注于客户。其多租户基础设施支持数百万客户,解决安全、成本和性能问题。团队通过迁移到Vercel,显著提升了生产力。

3600亿个令牌,300万客户,6名工程师

Vercel News
Vercel News · 2026-03-18T04:00:00Z
Managed OpenClaw旨在消除AI代理的隐性令牌税

Featherless推出了Managed OpenClaw,这是一个为开源AI代理提供的托管环境,旨在简化基础设施管理。该服务通过固定月费消除开发者的成本不确定性,支持24/7运行,允许开发者在安全的沙箱中运行高性能代理,帮助开发者专注于构建而非管理运行时。

Managed OpenClaw旨在消除AI代理的隐性令牌税

The New Stack
The New Stack · 2026-03-17T13:00:18Z
零售中的支付编排与令牌库架构

支付编排和令牌库在结账和全球支付处理中至关重要,确保交易顺畅,减少服务中断带来的损失。支付编排优化交易路由,令牌库保护敏感信息,提升合规性和灵活性。商家通过快速决策和实时数据,有效应对高峰期挑战。

零售中的支付编排与令牌库架构

Redis Blog
Redis Blog · 2026-03-16T00:00:00Z
有网友找到Perplexity密钥可实现模型白嫖 Perplexity回应称兄弟请查看账单

网友发现 Perplexity Computer 的 API 令牌存在安全隐患,因可被提取用于其他软件。Perplexity 解释称令牌属于用户,因异步计费未及时显示费用而撤销令牌,以防账单问题,但用户认为此举不安全,需改进。

有网友找到Perplexity密钥可实现模型白嫖 Perplexity回应称兄弟请查看账单

蓝点网
蓝点网 · 2026-03-14T03:00:53Z
通过符合RFC 9457的错误响应将代理令牌成本削减98%

Cloudflare为AI代理提供结构化的Markdown和JSON格式的错误响应,取代传统的HTML错误页面。这种新格式减少了负载和令牌使用,提供明确的操作指导,提升了效率。代理可根据错误类型采取相应措施,简化错误处理流程。

通过符合RFC 9457的错误响应将代理令牌成本削减98%

The Cloudflare Blog
The Cloudflare Blog · 2026-03-11T13:05:00Z
谷歌开始解封反重力权限 被封用户删除客户端重新登录(清理令牌)即可

谷歌开始解封部分轻微违规的反重力账户,用户只需卸载客户端并重新登录即可恢复使用。严重滥用的账户,尤其是批量注册和商业售卖的,可能会被永久封禁。此举旨在平息舆论,维护开发者生态。

谷歌开始解封反重力权限 被封用户删除客户端重新登录(清理令牌)即可

蓝点网
蓝点网 · 2026-02-27T08:25:05Z
代码模式:在1000个令牌内为代理提供完整的API

模型上下文协议(MCP)已成为AI代理使用外部工具的标准,但工具数量与上下文窗口空间存在矛盾。通过让模型编写代码的代码模式可以减少上下文使用。Cloudflare推出的新MCP服务器仅需两个工具,显著降低API调用的输入令牌数量,提高了效率。

代码模式:在1000个令牌内为代理提供完整的API

The Cloudflare Blog
The Cloudflare Blog · 2026-02-20T14:00:00Z
如何降低大型语言模型令牌成本并加快AI应用速度

大型语言模型(LLM)优化旨在减少令牌消耗、降低API成本并提高响应速度。通过简化提示、限制输出长度和使用语义缓存等方法,可以显著提升应用性能,减少用户流失,令牌优化可降低高达73%的API费用。

如何降低大型语言模型令牌成本并加快AI应用速度

Redis Blog
Redis Blog · 2026-02-19T00:00:00Z
谷歌封禁大量Antigravity IDE账号 用户若使用令牌对接其他服务则可能被封禁

谷歌因用户违规提取OAuth令牌,封禁大量Google Antigravity账号,包括付费用户。用户通过OAuth接入其他工具,违反服务条款,导致403禁止访问。解封需联系谷歌并提供相关信息。

谷歌封禁大量Antigravity IDE账号 用户若使用令牌对接其他服务则可能被封禁

蓝点网
蓝点网 · 2026-02-13T04:24:57Z
引入新的令牌格式和秘密扫描

Vercel 现已自动撤销意外提交到公共 GitHub 仓库的 API 凭证,以增强账户安全。用户在检测到凭证暴露后会收到通知,并可在仪表板中查看相关信息。此功能由 GitHub 秘密扫描支持,并更新了凭证格式以便识别。建议用户定期检查和更新凭证。

引入新的令牌格式和秘密扫描

Vercel News
Vercel News · 2026-02-09T13:00:00Z
减少MCP令牌冗余的10种策略

模型上下文协议(MCP)正面临转折,多个MCP服务器同时运行导致冗余。专家建议减少工具数量、优化上下文使用,并采用渐进式披露和智能检索等策略,以提升性能和降低令牌消耗。MCP最佳实践仍在发展中。

减少MCP令牌冗余的10种策略

The New Stack
The New Stack · 2026-02-05T15:37:25Z

Moltbook论坛因数据库配置不当泄露475万条记录,包括150万个API令牌和3.5万个电子邮件地址。安全公司Wiz发现Supabase数据库未按建议配置RLS,导致数据暴露,攻击者易于访问。这一事件凸显了AI生成代码的安全隐患。

AI智能体专用论坛Moltbook数据库泄露 暴露超过150万个API令牌和部分电子邮件地址

蓝点网
蓝点网 · 2026-02-03T00:58:53Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码