小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

文章探讨了大模型的使用成本,特别是输入、输出和缓存的费用。模型越大,能力越强,价格越高。推理过程分为预填充和解码,前者并行处理,后者逐个生成,导致计算量非线性增长。通过缓存技术可以降低重复计算成本,有效的上下文管理和明确的需求描述有助于节省Token,提升使用效率。

LLM Token 消耗节省计划

范叶亮的博客
范叶亮的博客 · 2026-04-25T00:00:00Z
使用Claude Code:会话管理与一百万上下文

我们推出了新的命令/usage,帮助用户理解Claude Code的使用情况。用户在管理会话时存在差异,尤其是在使用一百万上下文的更新后。上下文窗口包含系统提示、对话、工具调用及其输出等。过多上下文会导致性能下降,称为上下文腐烂。用户可以选择继续、回退、清除或压缩会话,以更好地管理上下文。对于新任务,建议开始新会话。使用子代理可以处理大量中间输出,最终只返回结果。

使用Claude Code:会话管理与一百万上下文

Claude
Claude · 2026-04-15T00:00:00Z
浅谈人工智能时代的用户体验:Agent Experience 导论

文章探讨了Agent Experience(AX)在人工智能产品设计中的重要性,强调优化用户输入、提高输出可控性和管理上下文污染。通过对比不同技术,提出动态上下文压缩和分层记忆管理的解决方案,以提升AI的理解和执行能力。最终,强调设计应关注用户的真实意图与认知,推动人本主义的AI设计理念。

浅谈人工智能时代的用户体验:Agent Experience 导论

少数派
少数派 · 2026-04-11T07:18:26Z

OpenClaw与Claude Code在上下文管理上有明显差异。Claude Code采用四层压缩机制,实时维护笔记,有效恢复上下文;而OpenClaw仅有单层压缩,且只在会话结束时归档,导致上下文丢失。此外,Claude Code的子代理角色明确,避免主线程上下文污染,而OpenClaw缺乏这种专门化。总体而言,Claude Code在长时间会话中表现更佳。

Claude Code与OpenClaw的上下文管理比较

Finisky Garden
Finisky Garden · 2026-04-07T15:49:33Z

Claude Code 和 OpenClaw 在上下文管理上存在显著差异。Claude Code 采用四层压缩策略,实时维护会话笔记,有效管理上下文,减少重复工作。而 OpenClaw 仅有一层压缩,且在会话结束时才归档,导致上下文丢失和重复。Claude Code 的子 Agent 专精于特定任务,而 OpenClaw 的子 Agent 通用性强但缺乏优化。整体而言,Claude Code 在长会话管理上表现更佳。

Claude Code 和 OpenClaw 的上下文管理对比

Finisky Garden
Finisky Garden · 2026-04-07T14:15:33Z

现代大型语言模型(LLM)应用通过上下文管理、工具调用和多步骤处理实现高效性。关键概念包括上下文工程、模型上下文协议、代理间通信和推理路由等,这些要素共同推动了技术进步。

10分钟讲解10个大型语言模型工程概念

KDnuggets
KDnuggets · 2026-04-07T12:00:31Z
Claude Code 省 Token 指南:慎用 1M 上下文,不开新会话或者总是开新会话都不对

Claude Code 的用户面临配额消耗过快的问题。频繁开启新会话会导致缓存失效,增加成本。建议保持活跃会话,利用提示缓存,减少重复计算。复杂任务应提前规划,简单任务可降低思考模式。合理管理上下文和模型选择,有助于节省 Token 消耗。

Claude Code 省 Token 指南:慎用 1M 上下文,不开新会话或者总是开新会话都不对

宝玉的分享
宝玉的分享 · 2026-04-06T00:00:00Z
编程智能体的核心组件【译】

编程智能体通过工具、记忆和代码上下文提升大语言模型的能力。文章介绍了其六大核心模块:实时代码仓库上下文、提示词缓存、工具调用、上下文管理、会话记忆和任务委派。这些模块协同工作,使编程智能体在处理编程任务时更高效,提升开发效率。

编程智能体的核心组件【译】

宝玉的分享
宝玉的分享 · 2026-04-05T00:00:00Z

Claude Code 的 RAG 机制采用动态检索策略,无需离线索引。模型根据上下文自主决定搜索内容和次数,分为四层检索架构,提升了检索的灵活性和精准度。通过子 Agent 和结果裁剪,优化了上下文管理,显著提高了效率。

拆解 Claude Code 的 RAG 机制

Finisky Garden
Finisky Garden · 2026-04-02T15:51:07Z
揭秘Claude Code真正秘密:为什么工具框架比模型更决定编码性能

Claude Code的优势在于其工具框架和上下文管理,而非仅仅是模型。通过精细的准备、专用工具和高效的上下文处理,提升了编码体验,支持子代理并行工作,确保流畅和便利。

揭秘Claude Code真正秘密:为什么工具框架比模型更决定编码性能

极道
极道 · 2026-04-02T00:21:00Z
评价和critical 批判下我的这个有关MCP的观点

CP的设计缺陷在于配置服务器时缺少description字段,导致无法实现渐进式加载,影响上下文管理并增加context rot风险。建议在MCP协议中增加description,以实现动态加载工具,提升扩展性和灵活性。目前的全量静态注入方式导致LLM注意力分散,增加错误调用概率。未来应考虑引入工具检索增强机制,以优化工具发现和加载。

评价和critical 批判下我的这个有关MCP的观点

王福强
王福强 · 2026-03-30T16:00:00Z
Claude Code最佳实践全解析:从AI工具到工程系统的完整进化路径与控制策略

本文总结了Claude Code的最佳实践,强调通过合理配置、权限管理和上下文管理,将AI工具转变为可控的工程系统。关键在于简化规则、使用子智能体隔离任务、明确指令,避免上下文混乱。作者建议保持CLAUDE.md简洁,设定权限白名单,并利用计划模式提高任务执行效率,最终目标是让AI辅助决策,而非完全替代人类。

Claude Code最佳实践全解析:从AI工具到工程系统的完整进化路径与控制策略

极道
极道 · 2026-03-26T02:58:00Z

OpenViking 是一种上下文管理解决方案,通过统一的文件系统管理记忆、资源和技能。其分层检索机制提高了检索效率,并支持可视化检索路径。用户可通过 API 管理账户、上传文件、创建和删除目录。OpenViking 与 OpenClaw 集成,增强了记忆管理功能,适用于日常运维和知识管理。

OpenViking 使用与 OpenClaw 集成

陈少文的博客
陈少文的博客 · 2026-03-24T00:00:00Z
你不知道的 Agent:原理、架构与工程实践

这篇文章探讨了Agent的架构与工程实践,重点分析了控制流、上下文管理、工具设计、记忆系统及多Agent组织等关键因素。作者强调了Harness在系统稳定性中的重要性,并提出了上下文分层管理和工具设计的原则。文章还讨论了通过有效评测和监控提升Agent性能的方法,并以OpenClaw为例展示这些原则的实际应用。

你不知道的 Agent:原理、架构与工程实践

Tw93 的博客
Tw93 的博客 · 2026-03-21T00:00:00Z
你不知道的 Claude Code:架构、治理与工程实践

本文探讨了Claude Code的架构与工程实践,分享了使用经验和最佳实践,重点包括上下文管理、技能设计、工具使用和验证机制。作者强调合理设计上下文和技能,避免信息污染,以确保系统的稳定性。通过分层管理和明确规则,可以提高Claude Code的效率和可靠性。

你不知道的 Claude Code:架构、治理与工程实践

Tw93 的博客
Tw93 的博客 · 2026-03-12T00:00:00Z
龙虾最大痛点被官方插件升级!对话永不忘记,GPT和Gemini最强模型都可接入

龙虾发布了OpenClaw测试版,新增上下文管理插件,增强对话记忆能力,支持多种上下文策略,解决长对话中的信息丢失问题。lossless-claw插件可持久化旧对话,提高系统效率。同时,更新还强化了Agent路由系统并优化了部署。

龙虾最大痛点被官方插件升级!对话永不忘记,GPT和Gemini最强模型都可接入

量子位
量子位 · 2026-03-09T05:02:00Z

本文探讨将大型语言模型(LLM)视为即兴喜剧演员,强调上下文管理的重要性。随着AI工具的发展,关注点已从提示工程转向上下文控制。使用MCP和子代理等工具可以提升输出质量。总体而言,AI工具的创新主要体现在上下文管理上,而非模型智能的提升。

上下文

年华转瞬
年华转瞬 · 2026-02-28T23:35:00Z
Claude Code 快速使用指南

本文介绍了Claude Code的实战指南,涵盖Flask应用的重构、上下文管理、Agent定制和插件扩展等功能,帮助开发者高效构建AI编程环境。通过实例,读者可掌握环境搭建、模式切换和任务管理等技巧。

Claude Code 快速使用指南

文艺数学君
文艺数学君 · 2026-02-20T23:40:57Z
规范驱动开发 – 企业规模的采用

随着无缝代理执行取代交互式提示,意图表达在编码代理中变得至关重要。规范驱动开发(SDD)有助于管理上下文,但现有工具在企业规模上存在不足。短期内,SDD需与现有工作流程整合,支持现有项目,并逐步启用复杂技术。长期来看,团队需建立直观理解,以有效使用SDD工具,促进利益相关者协作。

规范驱动开发 – 企业规模的采用

InfoQ
InfoQ · 2026-02-19T09:00:00Z
让人工智能主动管理其上下文

文章讨论了人工智能在上下文管理中的主动性,提出通过压缩和时间旅行功能优化对话体验。当前上下文管理主要关注信息输入和查找,缺乏有效的清理机制。建议AI主动管理上下文,选择加载和卸载内容,以提高长对话和多主题场景中的效率。设计类似于Git的会话树可以帮助AI更好地处理和回溯对话内容,实现更高效的上下文管理。

让人工智能主动管理其上下文

Tmr Blog
Tmr Blog · 2026-02-08T12:30:03Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码