小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Kubernetes v1.36更新了内存QoS功能,采用cgroup v2内存控制器,提供内存预留、分层保护和可观察性指标。Guaranteed Pods使用memory.min进行硬保护,Burstable Pods使用memory.low进行软保护。新版本允许在节点有足够余量时选择性启用内存预留,提升了内存管理的灵活性和效率。

Kubernetes v1.36:基于内存QoS的分层内存保护

Kubernetes Blog
Kubernetes Blog · 2026-04-29T18:35:00Z

分层架构自1968年Dijkstra提出以来,仍是软件工程的核心思想。它通过将系统分为多个层次,帮助开发者管理复杂性,强调关注点分离和依赖管理。严格分层与宽松分层各有优缺点,影响可测试性和性能。依赖倒置原则改变了传统依赖方向,使业务逻辑层不再依赖数据访问层。Spring Boot和Django等框架体现了分层架构的应用。

【系统架构设计】分层架构:最古老的模式为何仍然有效

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z
.NET+AI | Agent Skills |从 SKILL.md 到 AIContext:MAF Agent Skills 的分层设计与工程化扩展

MAF(Microsoft Agent Framework)通过五层架构将Agent Skills转变为可动态加载的能力单元,强调技能标准化描述和统一建模,适用于多租户电商客服场景。

.NET+AI | Agent Skills |从 SKILL.md 到 AIContext:MAF Agent Skills 的分层设计与工程化扩展

dotNET跨平台
dotNET跨平台 · 2026-04-10T00:02:22Z
如何构建一个成本高效的AI代理,采用分层模型路由

许多AI代理教程错误地将所有任务分配给最昂贵的模型。本文提出了一种分层路由系统,根据任务需求将任务分配给更便宜的模型,从而降低成本。通过Python进行简单检查,仅在必要时调用复杂模型,显著减少每个URL的审计成本。

如何构建一个成本高效的AI代理,采用分层模型路由

freeCodeCamp.org
freeCodeCamp.org · 2026-04-08T22:59:09Z
精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

北京大学彭宇新团队提出了分类感知表征对齐方法TARA,旨在解决多模态大模型在生物类别分层识别中的挑战,提升细粒度和分层视觉识别的准确率。该方法通过对齐大模型与生物基础模型的表征,注入类别树知识,从而增强模型的识别能力。

精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

量子位
量子位 · 2026-03-21T09:48:18Z

PostgreSQL的高可用性应采用分层设计,首先明确故障范围、恢复点目标(RPO)和恢复时间目标(RTO)。从单主节点开始,逐步引入离线备份、WAL归档和热备份,最终实现多站点灾难恢复。每一层增加特定能力,以确保系统的稳定性和可恢复性,避免高压操作。

Umair Shahid:将PostgreSQL高可用性视为分层设计

Planet PostgreSQL
Planet PostgreSQL · 2026-03-09T14:03:16Z
构建代理MLOps:基于A2A和MCP的分层协议策略

通过结合模型上下文协议(MCP)与代理间协议(A2A),构建灵活的多代理系统,支持动态协作与能力扩展,适用于MLOps等领域,推动AI代理实现更高的自动化与适应性。

构建代理MLOps:基于A2A和MCP的分层协议策略

InfoQ
InfoQ · 2026-02-16T09:00:00Z
分层大语言模型架构的异步验证语义缓存

本文介绍了一种名为Krites的异步语义缓存策略,旨在提高大语言模型(LLM)的推理效率。Krites通过验证静态缓存的响应,扩大了静态覆盖范围,允许未来的请求重用经过验证的答案。实验表明,Krites在对话和搜索任务中,使用经过验证的静态答案的请求比例提高了最多3.9倍,同时保持了延迟不变。

分层大语言模型架构的异步验证语义缓存

Apple Machine Learning Research
Apple Machine Learning Research · 2026-02-16T00:00:00Z
Kimi 的一体化,Manus 的分层

Kimi推出了新旗舰模型K2.5及其智能体K2.5 Agent,首次实现两者结合。K2.5在性能上超越K2,Agent具备视觉编程和蜂群功能,用户可直接生成动画和网站。这一整合提升了用户体验,拓展了市场潜力。

Kimi 的一体化,Manus 的分层

阮一峰的网络日志
阮一峰的网络日志 · 2026-01-29T08:02:30Z
AWS为S3 Tables新增智能分层和复制功能

AWS最近推出S3 Tables的新功能,包括智能分层存储和复制支持。智能分层根据访问模式自动优化存储成本,数据在30天后转入低频访问,90天后转入归档访问。复制支持可在不同AWS区域和账户间自动维护一致的表副本,用户可通过AWS CLI管理存储层级,无需额外费用配置智能分层。

AWS为S3 Tables新增智能分层和复制功能

InfoQ
InfoQ · 2026-01-05T10:18:00Z
在线教程|精准图像分层,Qwen-Image-Layered突破目标图层编辑痛点,兼顾高保真与一致性

Qwen团队推出Qwen-Image-Layered模型,实现图像分层编辑,允许独立操作各个图层,提升编辑质量。该模型将图像分解为多个RGBA图层,确保高保真度。用户可在HyperAI官网体验该功能。

在线教程|精准图像分层,Qwen-Image-Layered突破目标图层编辑痛点,兼顾高保真与一致性

HyperAI超神经
HyperAI超神经 · 2025-12-26T08:19:59Z
在线教程|精准图像分层,Qwen-Image-Layered突破目标图层编辑痛点,兼顾高保真与一致性

Qwen团队推出Qwen-Image-Layered模型,实现图像分层编辑,用户可独立操作各图层,提升编辑质量。可在HyperAI官网体验,教程提供详细步骤。

在线教程|精准图像分层,Qwen-Image-Layered突破目标图层编辑痛点,兼顾高保真与一致性

HyperAI超神经
HyperAI超神经 · 2025-12-25T12:01:41Z
演讲:从混乱的仪表板到分层的可观察性:构建更好的层次

本文讨论了如何将混乱的仪表板转变为分层的可观察性系统。作者Martha Lambert分享了在构建可靠事件管理产品过程中,通过预测、验证和测量提升可观察性的重要性。她强调团队合作和清晰仪表板在快速定位问题中的作用,指出良好的可观察性依赖于工具和团队的共同理解与参与。

演讲:从混乱的仪表板到分层的可观察性:构建更好的层次

InfoQ
InfoQ · 2025-11-19T13:37:00Z
Qdrant 1.16 - 分层多租户与磁盘高效向量搜索

Qdrant 1.16.0版本推出,新增分层多租户、ACORN搜索算法和内联存储功能,提升向量和文本搜索效率。支持条件更新,避免数据覆盖,同时优化Web UI界面,提升用户体验。

Qdrant 1.16 - 分层多租户与磁盘高效向量搜索

Qdrant - Vector Database
Qdrant - Vector Database · 2025-11-19T08:00:00Z
分层防御是应对人工智能驱动的网络威胁的关键,云原生计算基金会报告指出

云原生计算基金会报告指出,人工智能驱动的网络攻击已成为重大威胁,企业需采用多层防御策略。2023年社交工程攻击增加135%。报告强调,单一安全工具无法应对复杂威胁,需结合入侵检测与预防系统。有效网络安全需投资技术、培训和基础设施,以应对不断演变的AI威胁。

分层防御是应对人工智能驱动的网络威胁的关键,云原生计算基金会报告指出

InfoQ
InfoQ · 2025-10-31T19:30:00Z
一文通透Native Sparse Attention(简称NSA)——动态分层下的“原生稀疏注意力”策略:将粗粒度的token压缩与细粒度的token选择相结合

DeepSeek R1引起关注,研究者提出新注意力机制NSA,旨在提高长上下文处理效率。NSA结合硬件优化与可训练设计,克服现有稀疏注意力方法的局限性,提升模型性能与训练效率。

一文通透Native Sparse Attention(简称NSA)——动态分层下的“原生稀疏注意力”策略:将粗粒度的token压缩与细粒度的token选择相结合

结构之法 算法之道
结构之法 算法之道 · 2025-10-03T12:43:44Z
追求银级:充分利用分层可观察性

企业正从单一可观察性平台转向分层存储,以应对高成本和日志数据激增。分层存储将数据分为金、银、铜三级,金级数据存储在高端平台,银级和铜级数据采用更经济的解决方案,从而降低总体拥有成本,提高数据可用性和分析能力。

追求银级:充分利用分层可观察性

The New Stack
The New Stack · 2025-08-28T17:00:24Z
分层解析:生成式人工智能与知识中心服务如何优化客户支持

生成式人工智能(GenAI)与知识中心服务(KCS)正在改变客户支持模式,提供实时个性化自助服务,提升客户满意度和支持效率,使支持工程师能专注于复杂任务,改善整体支持质量。

分层解析:生成式人工智能与知识中心服务如何优化客户支持

Elastic Blog - Elasticsearch, Kibana, and ELK Stack
Elastic Blog - Elasticsearch, Kibana, and ELK Stack · 2025-07-22T00:00:00Z

京东利用Apache Doris构建广告数据存储服务,提供实时报表和多维分析。随着数据量激增,存储资源成为瓶颈。通过冷热数据分层方案,优化存储和查询效率,降低成本。Doris 2.0支持冷数据存储于分布式系统,提升查询能力,存储成本降低约87%。

京东广告基于Apache Doris的冷热数据分层实践

京东科技开发者
京东科技开发者 · 2025-07-16T05:32:22Z
QuantSpec:基于分层量化KV缓存的自我推测解码

大型语言模型(LLMs)在边缘设备上的应用日益增加,需快速高效地进行长上下文推理。KV缓存是主要瓶颈。为此,提出了QuantSpec框架,采用分层4位量化KV缓存,保持高接受率(>90%),实现约2.5倍的速度提升,并减少内存需求约1.3倍。

QuantSpec:基于分层量化KV缓存的自我推测解码

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码