小红花·文摘 - 小红花技术领袖俱乐部

Mastra与LangChain：构建AI代理管道及数据分析

Mastra与LangChain：构建AI代理管道及数据分析

freeCodeCamp.org ·

OpenClaw上下文浪费7千Token？SMELT相关性筛选降本95%

OpenClaw上下文浪费7千Token？SMELT相关性筛选降本95%

极道 ·

AI驱动的代码编辑器Cursor推出动态上下文发现方法以提高令牌效率

AI驱动的代码编辑器Cursor推出动态上下文发现方法以提高令牌效率

InfoQ ·

大型语言模型应用中令牌使用跟踪初学者指南

大型语言模型应用中令牌使用跟踪初学者指南

KDnuggets ·

本研究提出了一种基于A*搜索算法的解码推理策略，优化了固定计算预算的利用。实验结果表明，该方法在保持大模型性能的同时，令牌使用量减少了3倍，计算通行次数减少30%，展示了结构化搜索在推理中的优势。

A*-Decoding: Token-Efficient Inference Scaling

BriefGPT - AI 论文速递 ·

本研究提出了一种“自我方面检索增强总结生成”框架，旨在解决传统总结方法的资源限制和泛化能力不足问题。该框架通过嵌入驱动的检索机制提取相关文本片段，优化令牌使用，实验结果表明其性能优于传统方法，有效缓解了令牌限制问题。

Aspect-Based Summarization with Self-Aspect Retrieval Enhanced Generation

BriefGPT - AI 论文速递 ·