Apple Machine Learning Research ·

面向治理的代理遥测在多智能体AI系统中的闭环执行

💡 原文英文，约300词，阅读约需1分钟。

📝

内容提要

提出的治理感知代理遥测（GAAT）架构实现了对企业多智能体AI系统的实时违规检测与自动政策执行，显著提高了电商系统的违规预防率，达到98.3%。

🎯

关键要点

企业多智能体AI系统每小时产生数千个代理间交互，现有可观察性工具无法执行治理。
现有工具如OpenTelemetry和Langfuse将治理视为下游分析问题，而非实时执行目标。
提出的治理感知代理遥测（GAAT）架构实现了遥测收集与自动政策执行的闭环。
GAAT引入了治理遥测架构（GTS），扩展了OpenTelemetry以包含治理属性。
GAAT具有实时政策违规检测引擎，使用OPA兼容的声明性规则，延迟低于200毫秒。
GAAT的治理执行总线（GEB）提供分级干预。
GAAT的可信遥测平面具有加密来源。
在一个五代理的电商系统中，GAAT实现了98.3%的违规预防率，检测延迟中位数为8.4毫秒。
在12000个真实生产轨迹中，GAAT达到了99.7%的违规预防率。
GAAT在统计验证中显示出显著性，95%自助法置信区间为[97.1%, 99.2%]。
GAAT的表现优于NeMo Guardrails风格的代理边界执行，提升了19.5个百分点。
提供了正式的属性规范，包括升级终止、冲突解决确定性和有限假阳性隔离，经过10000次蒙特卡洛模拟验证。

❓

延伸问答

GAAT架构的主要功能是什么？

GAAT架构实现了遥测收集与自动政策执行的闭环，能够实时检测违规并执行政策。

GAAT在电商系统中的违规预防率是多少？

在一个五代理的电商系统中，GAAT实现了98.3%的违规预防率。

GAAT如何提高政策执行的实时性？

GAAT使用OPA兼容的声明性规则，具有低于200毫秒的检测延迟，确保实时政策执行。

GAAT与现有工具相比有什么优势？

GAAT的表现优于NeMo Guardrails风格的代理边界执行，提升了19.5个百分点的违规预防率。

GAAT的治理遥测架构（GTS）有什么特点？

GTS扩展了OpenTelemetry，包含治理属性，增强了对政策执行的支持。

GAAT的统计验证结果如何？

GAAT在统计验证中显示出显著性，95%自助法置信区间为[97.1%, 99.2%]，p值小于0.001。

🏷️

继续阅读

通过Claude托管代理，Anthropic希望为您管理AI代理
新服务的定价结构清晰明了，用户根据模型的令牌使用量付费，并需支付每小时$0.08的活跃运行费用。空闲时间不计入运行时间，网络搜索每1,000次额外收费$10。
构建一个基于标记存储模式的多租户配置系统
在现代微服务架构中，配置管理面临快速变化的租户元数据和扩展性挑战。传统缓存策略存在过时数据和性能损失的问题。本文提出了一种可扩展的多租户配置服务架构，利用...
维博尔·库马尔：边缘AI与Postgres中的真相
边缘AI正迎来关键时刻，因网络不稳定和隐私法规加强，成功架构需在弱连接下做出正确决策。PostgreSQL 18通过异步I/O和OAuth认证等功能，成为...
AI内存短缺也在推高SSD价格
由于AI行业需求激增，SSD和HDD价格大幅上涨，SSD价格已是去年12月的两到三倍。主要品牌如三星、SK海力士和美光主导市场，导致消费者库存减少。
全新的AI驱动谷歌财经正在扩展至100多个国家。
谷歌财经将于100多个国家推出AI驱动的新功能，包括AI研究、先进可视化工具、实时信息和直播财报，支持本地语言，帮助用户更好理解金融市场。
武大文科教授硬核跨界AI：半年项目量猛涨4000%，重构AI图表生产力
武汉大学王琼教授团队推出的“爱图表”是全球首个AI图表智能体，能够深度编辑AI生成的图表，克服传统工具的局限。该系统通过数据上传自动生成专业图表，并支持用...