量子位 ·

华为升级行业Agent算法架构！MindScale自己写prompt和工作流，KV Cache减少5.7倍token

💡 原文中文，约2400字，阅读约需6分钟。

📝

内容提要

华为升级了MindScale算法架构，提升开发效率，解决工作流维护和知识复用等挑战。新算法支持自动生成工作流和优化提示词，显著提高推理效率，并适配国产硬件，推动行业智能化应用。

🎯

关键要点

华为升级了MindScale算法架构，提升开发效率，解决工作流维护和知识复用等挑战。
MindScale项目识别了行业Agent发展的四大核心挑战：工作流手工维护、历史知识复用难、训推效率瓶颈和复杂推理测评。
MindScale提供了自进化的Agent算法EvoFabric，支持从自然语言文档生成可执行的工作流。
算法框架实现了基于记忆的演进，优化Agent的使用效果。
MindScale引入了prompt在线优化算法SCOPE和大模型prompt优化器C-MOP，实现提示词的自动优化。
MindScale注重训推效率优化，推出了TrimR算法，显著降低推理时延。
MindScale提供了基于KV Cache的推理方案，减少生成token数，提高推理性能。
MindScale包含适配昇腾硬件的代码实现，支持国产算力的高效Agent构建。

❓

延伸问答

华为的MindScale算法架构有什么主要功能？

MindScale算法架构主要提升开发效率，支持自动生成工作流和优化提示词，适配国产硬件，推动行业智能化应用。

MindScale如何解决工作流维护的挑战？

MindScale通过自进化的Agent算法EvoFabric，支持从自然语言文档生成可执行的工作流，减少对专家经验的依赖。

KV Cache在MindScale中的作用是什么？

KV Cache在MindScale中被视为一种轻量表示，能够减少生成token数，提高推理性能，最高可减少5.7倍token。

MindScale如何优化推理效率？

MindScale通过TrimR算法和基于KV Cache的推理方案，显著降低推理时延，并适配高并发场景。

MindScale的prompt优化机制是怎样的？

MindScale引入了SCOPE和C-MOP算法，实现提示词的在线优化和自动优化，提升推理精度。

MindScale适配哪些硬件？

MindScale包含适配昇腾硬件的代码实现，支持基于国产算力的高效Agent构建。

🏷️

继续阅读

教你薅token：构建agent无关的AI工作流
目前使用AI的主要痛点是高昂的账单。用户可以通过维护良好的文档来优化使用流程，减少对高价Agent的依赖。合理利用免费资源可以节省开支，维护好文档有助于降...
原华为盘古大模型负责人王云鹤离职创业；苹果硬件负责人启动重大重组；OpenAI联合创始人加入Anthropic
近期多家科技公司高管频繁变动。华为盘古大模型负责人王云鹤离职创业，成立新公司“基元律动”；阿里副总裁张凯夫也离职创业，专注市场行为预测；苹果硬件部门进行重...
构建新一代 AI Token 算力服务平台：KeyCompute 技术架构剖析
KeyCompute 是一个 AI Token 算力服务平台，旨在帮助中小企业和开发者管理多模型混用、账号池和计费等复杂链路。该平台使用 Rust 语言构...
线上剧本杀「多房间 + 多角色 + 强流程」的实时音视频架构
线上剧本杀结合多房间、角色权限和严格流程，技术复杂度高于普通视频聊天。关键在于动态音频拓扑、信息隔离和流程引擎。DM可控制房间和广播信息，玩家可在不同房间...
规模化架构：如何将视频会议从单服务器扩展到高可用系统
视频会议的扩展面临挑战，需分三个阶段进行架构设计：单节点阶段适合初期验证，水平扩展阶段需分离媒体处理与编排，以确保高可用性并消除单点故障。通过智能放置和自...
扣子3.0实测：手机就能远程遥控你电脑里的Agent
扣子3.0正式发布，升级了AI团队协作功能。用户可通过简单指令调动多个专业Agent共同完成复杂任务，如制作网页Demo和视频方案。新版本支持多端同步，能...