小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Mastra与LangChain:构建AI代理管道及数据分析

本文比较了AI支持平台Mastra和LangChain的性能。通过相同的五步研究和合成流程,测量了每一步的延迟和令牌使用情况。结果显示,LangChain在速度和令牌使用上表现更优,而Mastra在复杂性管理上提供了便利。

Mastra与LangChain:构建AI代理管道及数据分析

freeCodeCamp.org
freeCodeCamp.org · 2026-06-13T07:17:36Z
OpenClaw上下文浪费7千Token?SMELT相关性筛选降本95%

SMELT编译器通过相关性筛选显著减少OpenClaw的令牌使用,节省高达95%。它智能筛选相关内容,避免重复发送固定文件,提升效率并降低成本。开发者TooCas指出,SMELT不仅是压缩,而是智能筛选,未来计划实现自动学习Markdown结构。

OpenClaw上下文浪费7千Token?SMELT相关性筛选降本95%

极道
极道 · 2026-04-03T22:29:00Z
AI驱动的代码编辑器Cursor推出动态上下文发现方法以提高令牌效率

Cursor推出了一种动态上下文发现方法,通过动态检索所需信息,减少发送给大型语言模型的请求上下文大小,从而降低令牌使用量。该方法结合了五种技术,包括将输出写入文件、保存完整历史记录和动态发现领域特定能力等,显著提高了开发效率,预计将在未来几周内向所有用户开放。

AI驱动的代码编辑器Cursor推出动态上下文发现方法以提高令牌效率

InfoQ
InfoQ · 2026-01-14T11:00:00Z
大型语言模型应用中令牌使用跟踪初学者指南

在构建大型语言模型应用时,跟踪令牌使用非常重要,因为每次API调用都会消耗令牌,影响成本和延迟。LangSmith可以记录、监控和可视化令牌使用,帮助用户分析项目性能,优化工作流程,降低费用。

大型语言模型应用中令牌使用跟踪初学者指南

KDnuggets
KDnuggets · 2025-10-14T14:00:41Z

本研究提出了一种基于A*搜索算法的解码推理策略,优化了固定计算预算的利用。实验结果表明,该方法在保持大模型性能的同时,令牌使用量减少了3倍,计算通行次数减少30%,展示了结构化搜索在推理中的优势。

A*-Decoding: Token-Efficient Inference Scaling

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种“自我方面检索增强总结生成”框架,旨在解决传统总结方法的资源限制和泛化能力不足问题。该框架通过嵌入驱动的检索机制提取相关文本片段,优化令牌使用,实验结果表明其性能优于传统方法,有效缓解了令牌限制问题。

Aspect-Based Summarization with Self-Aspect Retrieval Enhanced Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码