小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Kubernetes v1.36版本中,动态资源分配(DRA)取得重要进展,新增功能包括通过优先列表定义设备请求的回退偏好、动态划分硬件资源、节点可分配资源管理,以及优化CPU和内存分配。新特性如资源池状态查询和设备元数据标准化,提升了硬件容量的可视化和管理。未来将深化DRA与调度的集成,推动用户从设备插件迁移至DRA。

Kubernetes v1.36:更多驱动程序、新功能与动态资源分配的下一个时代

Kubernetes Blog
Kubernetes Blog · 2026-05-07T18:35:00Z
DRA P1:DRA 能解决什么问题?从部署到使用的完整体验

DRA(动态资源分配)是Kubernetes为克服DevicePlugin局限性而推出的新框架,允许用户精确申请GPU资源,调度器能够获取设备详细信息,避免调度冲突。DRA支持资源预留和共享,提升了资源管理的灵活性和效率,通过ResourceSlice和DeviceClass实现了对设备属性的全面描述,标志着Kubernetes在资源管理上的重大进步。

DRA P1:DRA 能解决什么问题?从部署到使用的完整体验

探索云原生
探索云原生 · 2026-05-06T20:00:00Z

Kubernetes v1.36计划于2026年4月发布,包含多个新特性和弃用功能。主要更新包括外部IP字段的弃用、gitRepo卷插件的永久禁用、SELinux卷挂载的改进,以及支持外部签名的ServiceAccount令牌以提升安全性。此外,新版本扩展了动态资源分配,支持可分区设备,提高集群效率。

Kubernetes v1.36 预览

Kubernetes Blog
Kubernetes Blog · 2026-03-30T00:00:00Z
Kubernetes GPU管理迎来重大升级

Nvidia工程师Kevin Klues指出,Kubernetes社区正在为AI工作负载构建基础功能。动态资源分配(DRA)解决了GPU请求问题,使其更灵活。新的工作负载抽象将允许用户定义调度约束,改善复杂AI部署。Kubernetes 1.35将于12月17日发布基本实现,未来十年将影响Kubernetes的发展。

Kubernetes GPU管理迎来重大升级

The New Stack
The New Stack · 2025-12-11T21:00:58Z
Kubernetes v1.34 引入了好处,但也带来了新的盲点

Kubernetes 1.34版本引入了动态资源分配、Linux节点交换支持和安全增强等特性,提升了灵活性和可管理性,但也增加了复杂性和潜在风险。平台工程师需在部署前进行充分测试,并更新监控和治理策略,以防止性能问题和资源浪费。

Kubernetes v1.34 引入了好处,但也带来了新的盲点

The New Stack
The New Stack · 2025-10-07T17:30:12Z
Kubernetes v1.34:DRA 可消耗容量

Kubernetes v1.34引入动态资源分配(DRA),支持跨多个Pod和容器的设备共享。用户可根据需求请求特定设备并定义自定义配置,允许多个资源请求共享同一设备,从而提升资源管理的灵活性和效率,适用于带宽等动态资源分配场景。

Kubernetes v1.34:DRA 可消耗容量

Kubernetes Blog
Kubernetes Blog · 2025-09-18T18:30:00Z
Kubernetes入门:针对GPU工作负载的动态资源分配(DRA)

动态资源分配(DRA)是Kubernetes的新特性,旨在提高GPU等专用硬件的管理效率。与传统设备插件架构相比,DRA支持动态资源分配、共享和细粒度配置,解决了资源利用不足的问题。通过新API对象如资源声明和设备类别,DRA优化了资源调度和管理,以适应现代工作负载需求。

Kubernetes入门:针对GPU工作负载的动态资源分配(DRA)

The New Stack
The New Stack · 2025-09-05T14:00:38Z
Kubernetes v1.34:动态资源分配(DRA)已升级至GA

Kubernetes v1.34正式发布,动态资源分配(DRA)核心功能上线,提供灵活的硬件管理框架。多个功能升级至beta,增强资源管理的控制和可观察性。新特性包括设备共享模型和资源健康状态监控,未来将持续优化DRA的性能和可靠性。

Kubernetes v1.34:动态资源分配(DRA)已升级至GA

Kubernetes Blog
Kubernetes Blog · 2025-09-01T18:30:00Z
Kubernetes v1.34 预览

Kubernetes v1.34计划于2025年8月发布,新增稳定的动态资源分配、服务账户令牌集成和Pod替换策略等功能,旨在提升资源管理和安全性,简化操作流程。

Kubernetes v1.34 预览

Kubernetes Blog
Kubernetes Blog · 2025-07-28T00:00:00Z
Kubernetes 1.32:DevOps与SRE的实际应用案例

Kubernetes 1.32版本引入了动态资源分配、自动清理PVC、Windows节点优雅关机、变更块跟踪、Pod级资源限制和增强可观察性等功能,旨在提升SRE和DevOps的工作效率,优化机器学习、测试环境和备份等场景的操作。

Kubernetes 1.32:DevOps与SRE的实际应用案例

DEV Community
DEV Community · 2025-05-09T23:37:00Z
Kubernetes v1.33:动态资源分配(DRA)新功能

Kubernetes v1.33引入了动态资源分配(DRA)新功能,DRA在v1.32进入beta,计划在v1.34正式发布。新特性包括驱动程序资源状态报告、可分区设备、设备污点与容忍、优先设备列表等,提升了设备管理的灵活性和用户体验。

Kubernetes v1.33:动态资源分配(DRA)新功能

Kubernetes Blog
Kubernetes Blog · 2025-05-01T18:30:00Z

本研究探讨城市空中出行(UAM)的系统架构与管理挑战,提出一种智能全息架构,利用大型语言模型(LLM)实现实时协调和动态资源分配,以提升交通网络的效率和抗干扰能力,为未来UAM生态系统奠定基础。

Urban Air Mobility as a System of Systems: A Holonic Approach Enhanced by Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z
Kubernetes v1.33 在人工智能、安全性和企业应用方面的进展

Kubernetes 1.33版本发布,新增64项功能,重点包括原生支持侧车容器、动态资源分配和用户命名空间,提升了安全性和可扩展性,简化了管理。

Kubernetes v1.33 在人工智能、安全性和企业应用方面的进展

The New Stack
The New Stack · 2025-04-24T22:00:43Z
250多篇论文,上海AI Lab综述推理大模型高效思考

大型推理模型(LRMs)在推理任务中表现优异,但生成过程常常冗长低效,影响训练和应用。研究提出了提升思考效率的策略,如控制思考长度和动态资源分配,以优化性能与成本的平衡。未来研究将关注多模态推理、可信赖性和高效应用等方向。

250多篇论文,上海AI Lab综述推理大模型高效思考

机器之心
机器之心 · 2025-04-04T05:47:39Z

本研究提出了一种新的时间公平框架,旨在动态资源分配中平衡公平性与效率。该方法结合历史折扣机制,增强了对人类公平感知的对齐,并提高了顺序决策的计算可行性。

记住与遗忘:通过历史折扣平衡短期与完美记忆的公平性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-01T00:00:00Z
Kubernetes 1.32发布,新增动态资源分配和Windows节点优雅关闭功能

云原生计算基金会(CNCF)发布Kubernetes 1.32版本,新增Windows节点优雅关闭支持、核心组件新状态端点及调度器异步抢占功能。动态资源分配(DRA)增强,改善AI/ML工作负载资源管理。版本还包括自动删除持久卷声明(PVCs)和生成OpenTelemetry追踪数据功能,共有44项增强,19项进入alpha,12项升级为beta,13项稳定可用。

Kubernetes 1.32发布,新增动态资源分配和Windows节点优雅关闭功能

InfoQ
InfoQ · 2024-12-29T22:00:00Z
Kubernetes 1.32 通过API合规性测试

在希腊神话中,奥德修斯经历十年艰难航程回到妻子佩内洛普身边。Kubernetes在发展十周年之际推出新logo,并发布1.32版本,首次通过100%合规性测试,引入改进的动态资源分配(DRA),以更好地支持AI和边缘计算需求。此版本包含44项增强功能,提升资源管理和兼容性。

Kubernetes 1.32 通过API合规性测试

The New Stack
The New Stack · 2024-12-11T22:00:46Z
Kubernetes v1.32:佩内洛普

Kubernetes v1.32发布了44项增强功能,其中13项稳定、12项Beta、19项Alpha。此次更新重点改进了动态资源分配(DRA),提升了资源管理的灵活性和效率,特别适合机器学习和高性能计算。新特性包括Pod级资源管理和异步抢占,增强了调度效率和资源利用率。

Kubernetes v1.32:佩内洛普

Kubernetes Blog
Kubernetes Blog · 2024-12-11T00:00:00Z
Kubernetes v1.32 预览

Kubernetes v1.32即将发布,计划进行API弃用和移除等功能变更。动态资源分配(DRA)将得到显著改进,支持Windows节点的优雅关机,环境变量名称允许特殊字符,负载均衡器行为优化,资源名称冲突处理将自动重试。详细信息请参见发布说明。

Kubernetes v1.32 预览

Kubernetes Blog
Kubernetes Blog · 2024-11-08T00:00:00Z

本文探讨了提升大型语言模型(LLMs)推理效率的方法,包括自适应计算、动态资源分配和新解码算法。研究表明,通过优化计算预算和引入新策略,可以显著提高模型性能和计算效率,尤其在资源有限的环境中。

学习如何决策思考强度:输入自适应分配语言模型计算资源

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码