小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
代理人工智能在生产中为何停滞不前——控制层如何解决这一问题

代理人工智能为SRE、平台工程师和AI/ML团队提供了机遇,但仅依赖生成模型无法满足生产系统需求。实现可靠的自主决策需依赖实时系统数据和控制层,以确保可扩展性和稳定性。

代理人工智能在生产中为何停滞不前——控制层如何解决这一问题

The New Stack
The New Stack · 2026-03-17T13:00:16Z
Kubernetes作为AI的操作系统:1.35版本的信号

Kubernetes v1.35版本增强了AI/ML操作的可预测性,推出了工作负载感知调度、稳定的Pod资源调整和更安全的配置输出,旨在简化操作并提高资源利用率。

Kubernetes作为AI的操作系统:1.35版本的信号

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-02-23T12:00:00Z
Kubernetes v1.35:就地重启 Pod 提升效率的新境界

Kubernetes 1.35 引入了“就地重启所有容器”功能,允许高效重置 Pod 状态,特别适合 AI/ML 工作负载。此功能避免了 Pod 的删除和重建,提升了系统灵活性和鲁棒性。启用 RestartAllContainersOnContainerExits 特性后,开发者可更专注于核心逻辑,简化故障处理。

Kubernetes v1.35:就地重启 Pod 提升效率的新境界

Kubernetes Blog
Kubernetes Blog · 2026-01-02T18:30:00Z
Kubernetes 1.35发布,新增In-Place Pod Resize功能及AI优化调度

云原生计算基金会发布Kubernetes 1.35版本“Timbernetes”,重点优化AI/ML工作负载。新增In-Place Pod Resize功能,支持在不重启容器的情况下调整资源。引入Gang Scheduling、PodGroup API和改进的HPA容忍度,简化证书管理。Ingress NGINX控制器将于2026年3月停止维护,建议迁移至Gateway API。

Kubernetes 1.35发布,新增In-Place Pod Resize功能及AI优化调度

InfoQ
InfoQ · 2025-12-31T10:00:00Z
演讲:循环中的人类:混乱行业中的工程领导力

米歇尔·布拉什是一名站点可靠性工程师,专注于分析系统故障并降低风险。尽管科技行业面临挑战,她仍对未来持乐观态度,并鼓励儿子学习计算机科学。她指出,随着AI/ML的发展,工程师的工作将变得更加复杂,需求也将增加,因此需要掌握系统思维、可靠性工程和应对复杂性的能力。

演讲:循环中的人类:混乱行业中的工程领导力

InfoQ
InfoQ · 2025-11-24T11:08:00Z
以好奇心引领云计算:聚焦Pranav Nambiar,AI/ML与PaaS高级副总裁

Pranav Nambiar加入DigitalOcean,旨在推动创新并支持建设者。他领导AI/ML和PaaS团队,致力于简化云计算,帮助客户充分利用现代技术。他认为DigitalOcean的基础、影响力和文化使其成为理想之地。

以好奇心引领云计算:聚焦Pranav Nambiar,AI/ML与PaaS高级副总裁

The DigitalOcean Blog
The DigitalOcean Blog · 2025-11-04T04:01:20Z
KubeCon + CloudNativeCon 北美 2025 联合活动深度探讨:云原生 + Kubernetes AI 日

云原生与Kubernetes AI日旨在提升Kubernetes在AI/ML和高性能计算中的应用,面向各级从业者,提供最佳实践和解决方案,促进MLOps与云原生AI项目的合作。今年主题为“代理”,包括10个完整会议和4个快速演讲,参与者可与专家交流,了解最新工具和成功案例。

KubeCon + CloudNativeCon 北美 2025 联合活动深度探讨:云原生 + Kubernetes AI 日

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2025-10-13T14:23:36Z
四个强大的新功能,助您在DigitalOcean Kubernetes上构建和部署更高效的应用

DigitalOcean推出了支持GPU的Droplet类型和自动缩减节点至零的新Kubernetes功能,优化了AI/ML工作负载,降低了闲置节点的计算费用,并提升了基础设施的灵活性和效率。同时,新数据中心ATL1已投入使用,增强了服务性能。

四个强大的新功能,助您在DigitalOcean Kubernetes上构建和部署更高效的应用

The DigitalOcean Blog
The DigitalOcean Blog · 2025-07-22T16:00:00Z
在使用设备的Pod中应对故障

Kubernetes在处理AI/ML工作负载时面临设备故障管理的挑战,因这些工作负载依赖专用硬件,故障会显著影响性能。目前Kubernetes对设备故障的支持不足,缺乏有效的处理机制。文章探讨了不同故障模式及其解决方案,并强调了社区在改进设备故障管理方面的努力。

在使用设备的Pod中应对故障

Kubernetes Blog
Kubernetes Blog · 2025-07-03T00:00:00Z
Kubeflow推动云原生AI:2025年KubeCon + CloudNativeCon欧洲大会的展望

Kubeflow社区因简化Kubernetes中的AI/ML体验而快速发展,提供端到端解决方案。在KubeCon + CloudNativeCon上,用户和贡献者分享技术与最佳实践。Kubeflow 1.10发布了新功能,包括模型注册的新UI和超参数优化,社区积极展示其在AI/ML中的应用。

Kubeflow推动云原生AI:2025年KubeCon + CloudNativeCon欧洲大会的展望

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2025-06-06T20:19:43Z
参加 AWS 云基础设施日,了解构建全球云基础设施的前沿创新技术

AWS 云基础设施日将于2025年5月22日举行,展示计算、AI/ML、存储和网络领域的最新创新。活动将通过多个平台直播,适合技术决策者和开发人员,提供深入的技术洞察和实践演示。

参加 AWS 云基础设施日,了解构建全球云基础设施的前沿创新技术

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-05-22T03:16:00Z
构建节能高效的AI/ML系统的最佳实践

使用AI/ML技术的组织需系统追踪模型生命周期的碳足迹,并实施最佳实践以降低能耗。主要挑战在于缺乏标准化计算方法和碳足迹测量的复杂性。最佳实践包括选择高效模型、优化复杂性、使用节能硬件和云托管。工具如CodeCarbon和MLCarbon可帮助追踪能耗,云平台如GCP和AWS也提供可持续性支持。

构建节能高效的AI/ML系统的最佳实践

InfoQ
InfoQ · 2025-05-09T11:00:00Z

DocSpiral平台通过人机协作解决特定领域图像文档中结构化数据提取的问题。该平台采用螺旋设计,减少人工干预,提高模型训练效率,标注时间减少41%,并在多个训练迭代中保持性能提升,促进图像密集型领域的AI/ML模型开发。

DocSpiral: An Integrated Assistive Document Annotation Platform through Human-Machine Collaboration

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z
宣布SAP Databricks在AWS上的正式发布

SAP Databricks已在AWS上正式推出,作为SAP Business Data Cloud的全托管服务,简化了AI和分析流程,支持企业在SAP平台内直接处理数据。通过Delta Sharing,SAP数据可安全共享,支持多种AI/ML应用,提升数据利用效率。

宣布SAP Databricks在AWS上的正式发布

Databricks
Databricks · 2025-04-30T20:36:42Z
我在多伦多的第一次AWS用户组聚会:re:Invent回顾——多么难忘的经历!

AWS用户组多伦多首次聚会回顾了2024年AWS re:Invent大会,分享了云计算、AI/ML和数据库等最新动态。参与者积极提问,讨论热烈,展现了社区精神。未来将继续举办活动,欢迎更多人参与。

我在多伦多的第一次AWS用户组聚会:re:Invent回顾——多么难忘的经历!

DEV Community
DEV Community · 2025-04-16T19:27:46Z
黑客马拉松的疑虑

这是我在这个平台上的第一篇帖子,希望能获得关于AIML领域的创意,特别是黑客马拉松的点子。

黑客马拉松的疑虑

DEV Community
DEV Community · 2025-04-11T18:57:55Z
CNCF研究揭示云原生技术如何重塑全球商业与创新

一项研究显示,云原生技术的采用率已达89%,安全关注点转向协作与效率。Kubernetes仍是行业标准,80%的组织在生产中使用。CI/CD的采用增长了31%,加速了软件交付。AI/ML在Kubernetes上的应用仍处于初期阶段,但未来有望推动创新。

CNCF研究揭示云原生技术如何重塑全球商业与创新

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2025-04-01T08:00:00Z
下一代技术

通过AI/ML、云计算、机器人流程自动化和数据可视化等先进数字服务,提高企业在快速变化的数字环境中的效率与创新能力,保持竞争力。

下一代技术

DEV Community
DEV Community · 2025-03-17T04:08:37Z
我们对于 GPU 的看法错了 [译]

Kurt Mackey探讨了在构建公共云服务时对GPU的反思。尽管AI/ML的重要性被低估,市场对GPU的需求未能得到满足,开发者更倾向于使用API而非自行搭建GPU环境。尽管投入巨大,最终发现GPU并非主流需求,安全性和开发者体验变得更加重要。

我们对于 GPU 的看法错了 [译]

宝玉的分享
宝玉的分享 · 2025-02-17T05:11:42Z
AI/ML工作流程中10个必知的开源平台工程工具

构建和交付AI/ML解决方案的速度至关重要,但基础设施复杂性和低效性带来了挑战。平台工程通过内部开发平台(IDP)简化工作流程,自动化重复任务,提高开发效率。2024年Dora报告显示,平台工程可提升部署频率60%、开发者生产力8%和团队表现10%。推荐的开源工具包括KitOps、Kubeflow和DVC等,助力简化AI/ML项目流程。

AI/ML工作流程中10个必知的开源平台工程工具

DEV Community
DEV Community · 2025-02-06T16:35:09Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码