小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文探讨了长上下文模型的工程挑战与解决方案,包括位置编码、注意力计算复杂度、训练策略和推理优化。随着上下文长度增加,模型面临计算复杂度和显存限制。采用RoPE、YaRN等技术扩展位置编码,并结合线性注意力和稀疏注意力优化计算效率。在训练方面,采用短预训练与长继续预训练相结合的策略,推理时利用前缀缓存和KV压缩等技术提高效率。

【大模型基础设施工程】16:长上下文工程

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
在数据与人工智能峰会上亲身体验代理、氛围编码等更多内容

Databricks将在2026年6月14日至18日于旧金山举办数据与人工智能峰会,提供新培训课程和认证。提前注册可享受50%折扣,现场认证考试费用为100美元。新推出的“上下文工程”认证将帮助AI工程师验证技能,参与者还可获得定制的Databricks认证外套和进入专属休息室的机会。

在数据与人工智能峰会上亲身体验代理、氛围编码等更多内容

Databricks
Databricks · 2026-04-20T13:00:00Z
GitHub AI记忆工具两大阵营揭秘:哪种让智能体越用越聪明

本文探讨了GitHub上的AI记忆工具,分为记忆后端和上下文基板两大阵营。记忆后端负责提取和存储事实,而上下文基板则维护结构化的可读上下文,适合持续运行的智能体。未来,上下文工程将成为主流,优化智能体的长期表现。

GitHub AI记忆工具两大阵营揭秘:哪种让智能体越用越聪明

极道
极道 · 2026-04-16T07:02:00Z
Elastic与Cursor合作加速编码代理的上下文工程

Elastic与Cursor深化合作,推出新插件,提升AI编码代理的上下文工程能力。开发者可在编辑器内访问实时生产日志和安全警报,优化编码工作流程。整合Elastic工具后,Cursor代理能更准确地执行复杂任务,推动产品创新,减少操作负担。

Elastic与Cursor合作加速编码代理的上下文工程

Elastic Blog - Elasticsearch, Kibana, and ELK Stack
Elastic Blog - Elasticsearch, Kibana, and ELK Stack · 2026-04-13T00:00:00Z

文章讨论了三种工程术语:提示工程、上下文工程和代理管理。提示工程关注与模型的交流方式;上下文工程强调提供模型所需的信息;代理管理涉及代理生命周期的资源调度。这三者解决不同层次的问题,混淆可能导致错误的解决方案。

代理工程的三种演变

Finisky Garden
Finisky Garden · 2026-04-08T16:19:33Z
大型语言模型的上下文工程指南

本文探讨了上下文工程在大型语言模型中的重要性。研究表明,过多的输入信息会降低模型性能,尤其是当相关信息位于输入中间时。上下文窗口的设计及信息选择与压缩策略至关重要,有效的上下文工程能够提升模型响应质量,避免信息丢失和注意力稀释。

大型语言模型的上下文工程指南

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-04-06T15:30:52Z
2026 AI 开发新范式:Harness Engineering(驾驭工程)为何是智能体的决胜点?

2026年,AI开发的关键在于“驾驭工程”,确保AI在无人干预下稳定、安全地完成复杂任务。文章探讨了提示词工程、上下文工程与驾驭工程的关系,强调驾驭工程的重要性,并构建了AI智能体的完整系统。通过有效的工程方法,AI能够更好地执行任务,提升应用的可靠性。

2026 AI 开发新范式:Harness Engineering(驾驭工程)为何是智能体的决胜点?

王欣的博客
王欣的博客 · 2026-04-05T02:00:00Z
OpenClaw核心原理与架构工程实践全解析:从控制流到多Agent系统的完整指南

本文探讨了Agent智能体系统的核心原理与工程实践,强调成功的关键在于测试与验证基础设施,而非模型能力。详细介绍了控制流、上下文工程、工具设计等八大模块,并通过OpenClaw开源实现展示设计原则的应用。强调了Agent的循环过程及其与工作流的区别,提出了多Agent组织的有效策略和安全措施,最后总结了常见问题及解决方案。

OpenClaw核心原理与架构工程实践全解析:从控制流到多Agent系统的完整指南

极道
极道 · 2026-03-23T23:23:00Z

上下文工程是优化大型语言模型(LLM)处理有限上下文窗口的策略,旨在管理整个输入上下文,确保模型关注重要信息。有效的上下文工程可以防止信息处理能力下降,避免准确性崩溃和指令漂移。通过压缩、子代理架构和文件系统等方法,提高信息传递效率,确保模型在多轮交互中保持高效和准确。

AI Agent 的上下文系统:Context Engineering 指南

luozhiyun`s Blog 我的技术分享
luozhiyun`s Blog 我的技术分享 · 2026-03-22T09:51:12Z
编码代理的上下文工程

Birgitta是Thoughtworks的工程师,专注于AI辅助交付。她探讨了编码代理的上下文工程,强调配置和丰富上下文的重要性,包括可重用提示和技能等,以提升开发者体验。有效的上下文管理需平衡信息量,避免干扰。尽管上下文工程能增强编码代理的效果,但对LLM的解释能力仍需谨慎。

编码代理的上下文工程

Martin Fowler
Martin Fowler · 2026-02-05T15:36:00Z
上下文工程:金融服务中可信AI的缺失层

上下文工程是金融服务中可信AI的核心,解决数据不全和治理问题。Elastic作为基础层,提供实时、可解释的智能,帮助金融机构在合规与效率之间取得平衡。

上下文工程:金融服务中可信AI的缺失层

Elastic Blog - Elasticsearch, Kibana, and ELK Stack
Elastic Blog - Elasticsearch, Kibana, and ELK Stack · 2026-01-30T08:00:00Z
不要再构建多Agent了

上下文工程在AI Agent开发中至关重要,强调共享完整轨迹和识别隐式决策以避免冲突。建议采用单线程线性架构,并通过LLM压缩对话历史,以处理长上下文。这为企业级AI Agent的构建提供了重要指导。

不要再构建多Agent了

Teach Talk
Teach Talk · 2026-01-29T04:43:20Z
RAG并未消亡,但上下文工程是新的热门趋势

RAG(检索增强生成)并未消亡,而是被称为“上下文工程”。Contextual AI推出了Agent Composer工具,帮助企业构建基于数据存储的代理,软件工程在代理时代持续演变,重点在于管理“整个上下文状态”。

RAG并未消亡,但上下文工程是新的热门趋势

The New Stack
The New Stack · 2026-01-27T15:00:02Z
虚拟座谈会 - AI在前线:开发者如何重塑软件开发流程

AI工具加速软件开发,但需强有力的上下文和验证。开发者角色转变为管理AI输出,需关注上下文工程。AI降低了初级开发者的入门门槛,但信任和技能成长依赖于指导和反馈。文化变革与技术整合同样重要,成功团队将AI融入共享流程,而非孤立使用。

虚拟座谈会 - AI在前线:开发者如何重塑软件开发流程

InfoQ
InfoQ · 2026-01-26T11:00:00Z

Ralph Wiggum Technique是一种新兴的AI编程方法,通过一行Bash脚本实现无限循环,自动读取项目目标并执行操作。该方法强调上下文工程的重要性,主张声明式编程而非命令式编程。Ralph能够高效重构代码,但需警惕“过度烘焙”的风险,未来编程将更多依赖规范维护而非具体逻辑编写。

从“手搓 Prompt”到“无限循环”:AI 编码的下一个形态是“Ralph”吗?

Tony Bai
Tony Bai · 2026-01-21T00:00:41Z
AI代理的记忆:上下文工程的新范式

当前AI代理的记忆至关重要。传统大型语言模型无状态,缺乏上下文。新记忆范式使代理能够有效利用过去的互动,从而提升对话质量。记忆管理技术能提高企业效率并降低成本,但也带来隐私和伦理问题,需谨慎处理。未来,记忆将成为AI发展的重要基础设施。

AI代理的记忆:上下文工程的新范式

The New Stack
The New Stack · 2026-01-16T15:00:44Z
想要更好的AI输出?试试上下文工程。

上下文工程是提升GitHub Copilot性能的关键方法,通过自定义指令、可重用提示和定制代理,帮助Copilot更好地理解开发者需求,从而生成更准确的代码,提高一致性和效率。

想要更好的AI输出?试试上下文工程。

The GitHub Blog
The GitHub Blog · 2026-01-12T17:00:00Z
上下文工程的三种难度级别解析

长时间运行的LLM应用在上下文管理不当时会退化。上下文工程将上下文窗口视为可管理资源,通过明确的分配策略和内存系统优化信息流。文章探讨了上下文工程的必要性、优化策略和高级内存架构,强调有效管理上下文的重要性,以避免信息丢失和性能下降。

上下文工程的三种难度级别解析

KDnuggets
KDnuggets · 2026-01-05T15:00:54Z
从提示词工程到上下文工程

在人工智能快速发展的背景下,提示词工程逐渐转向上下文工程。上下文工程关注信息的系统性、动态性和准确性,旨在为大型语言模型提供必要的背景信息和工具,强调构建信息支撑系统,以提升AI的智能性和可靠性。

从提示词工程到上下文工程

dotNET跨平台
dotNET跨平台 · 2025-12-25T00:02:28Z
Agent 教程笔记(Task04)

上下文工程关注智能体上下文状态的有效管理,强调信息的组织与压缩。通过系统提示、工具调用和结构化示例,优化上下文窗口的使用,避免信息腐蚀。采用子代理架构和长期笔记工具,提高信息检索与管理效率,实现高质量的智能体交互。

Agent 教程笔记(Task04)

程序员充电站
程序员充电站 · 2025-12-23T16:31:36Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码