小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
代理人工智能在生产中为何停滞不前——控制层如何解决这一问题

代理人工智能为SRE、平台工程师和AI/ML团队提供了机遇,但仅依赖生成模型无法满足生产系统需求。实现可靠的自主决策需依赖实时系统数据和控制层,以确保可扩展性和稳定性。

代理人工智能在生产中为何停滞不前——控制层如何解决这一问题

The New Stack
The New Stack · 2026-03-17T13:00:16Z
Kubernetes作为AI的操作系统:1.35版本的信号

Kubernetes v1.35版本增强了AI/ML操作的可预测性,推出了工作负载感知调度、稳定的Pod资源调整和更安全的配置输出,旨在简化操作并提高资源利用率。

Kubernetes作为AI的操作系统:1.35版本的信号

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-02-23T12:00:00Z
Kubernetes v1.35:就地重启 Pod 提升效率的新境界

Kubernetes 1.35 引入了“就地重启所有容器”功能,允许高效重置 Pod 状态,特别适合 AI/ML 工作负载。此功能避免了 Pod 的删除和重建,提升了系统灵活性和鲁棒性。启用 RestartAllContainersOnContainerExits 特性后,开发者可更专注于核心逻辑,简化故障处理。

Kubernetes v1.35:就地重启 Pod 提升效率的新境界

Kubernetes Blog
Kubernetes Blog · 2026-01-02T18:30:00Z
Kubernetes 1.35发布,新增In-Place Pod Resize功能及AI优化调度

云原生计算基金会发布Kubernetes 1.35版本“Timbernetes”,重点优化AI/ML工作负载。新增In-Place Pod Resize功能,支持在不重启容器的情况下调整资源。引入Gang Scheduling、PodGroup API和改进的HPA容忍度,简化证书管理。Ingress NGINX控制器将于2026年3月停止维护,建议迁移至Gateway API。

Kubernetes 1.35发布,新增In-Place Pod Resize功能及AI优化调度

InfoQ
InfoQ · 2025-12-31T10:00:00Z
演讲:循环中的人类:混乱行业中的工程领导力

米歇尔·布拉什是一名站点可靠性工程师,专注于分析系统故障并降低风险。尽管科技行业面临挑战,她仍对未来持乐观态度,并鼓励儿子学习计算机科学。她指出,随着AI/ML的发展,工程师的工作将变得更加复杂,需求也将增加,因此需要掌握系统思维、可靠性工程和应对复杂性的能力。

演讲:循环中的人类:混乱行业中的工程领导力

InfoQ
InfoQ · 2025-11-24T11:08:00Z
以好奇心引领云计算:聚焦Pranav Nambiar,AI/ML与PaaS高级副总裁

Pranav Nambiar加入DigitalOcean,旨在推动创新并支持建设者。他领导AI/ML和PaaS团队,致力于简化云计算,帮助客户充分利用现代技术。他认为DigitalOcean的基础、影响力和文化使其成为理想之地。

以好奇心引领云计算:聚焦Pranav Nambiar,AI/ML与PaaS高级副总裁

The DigitalOcean Blog
The DigitalOcean Blog · 2025-11-04T04:01:20Z
KubeCon + CloudNativeCon 北美 2025 联合活动深度探讨:云原生 + Kubernetes AI 日

云原生与Kubernetes AI日旨在提升Kubernetes在AI/ML和高性能计算中的应用,面向各级从业者,提供最佳实践和解决方案,促进MLOps与云原生AI项目的合作。今年主题为“代理”,包括10个完整会议和4个快速演讲,参与者可与专家交流,了解最新工具和成功案例。

KubeCon + CloudNativeCon 北美 2025 联合活动深度探讨:云原生 + Kubernetes AI 日

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2025-10-13T14:23:36Z
四个强大的新功能,助您在DigitalOcean Kubernetes上构建和部署更高效的应用

DigitalOcean推出了支持GPU的Droplet类型和自动缩减节点至零的新Kubernetes功能,优化了AI/ML工作负载,降低了闲置节点的计算费用,并提升了基础设施的灵活性和效率。同时,新数据中心ATL1已投入使用,增强了服务性能。

四个强大的新功能,助您在DigitalOcean Kubernetes上构建和部署更高效的应用

The DigitalOcean Blog
The DigitalOcean Blog · 2025-07-22T16:00:00Z
在使用设备的Pod中应对故障

Kubernetes在处理AI/ML工作负载时面临设备故障管理的挑战,因这些工作负载依赖专用硬件,故障会显著影响性能。目前Kubernetes对设备故障的支持不足,缺乏有效的处理机制。文章探讨了不同故障模式及其解决方案,并强调了社区在改进设备故障管理方面的努力。

在使用设备的Pod中应对故障

Kubernetes Blog
Kubernetes Blog · 2025-07-03T00:00:00Z
Kubeflow推动云原生AI:2025年KubeCon + CloudNativeCon欧洲大会的展望

Kubeflow社区因简化Kubernetes中的AI/ML体验而快速发展,提供端到端解决方案。在KubeCon + CloudNativeCon上,用户和贡献者分享技术与最佳实践。Kubeflow 1.10发布了新功能,包括模型注册的新UI和超参数优化,社区积极展示其在AI/ML中的应用。

Kubeflow推动云原生AI:2025年KubeCon + CloudNativeCon欧洲大会的展望

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2025-06-06T20:19:43Z
参加 AWS 云基础设施日,了解构建全球云基础设施的前沿创新技术

AWS 云基础设施日将于2025年5月22日举行,展示计算、AI/ML、存储和网络领域的最新创新。活动将通过多个平台直播,适合技术决策者和开发人员,提供深入的技术洞察和实践演示。

参加 AWS 云基础设施日,了解构建全球云基础设施的前沿创新技术

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-05-22T03:16:00Z
构建节能高效的AI/ML系统的最佳实践

使用AI/ML技术的组织需系统追踪模型生命周期的碳足迹,并实施最佳实践以降低能耗。主要挑战在于缺乏标准化计算方法和碳足迹测量的复杂性。最佳实践包括选择高效模型、优化复杂性、使用节能硬件和云托管。工具如CodeCarbon和MLCarbon可帮助追踪能耗,云平台如GCP和AWS也提供可持续性支持。

构建节能高效的AI/ML系统的最佳实践

InfoQ
InfoQ · 2025-05-09T11:00:00Z

DocSpiral平台通过人机协作解决特定领域图像文档中结构化数据提取的问题。该平台采用螺旋设计,减少人工干预,提高模型训练效率,标注时间减少41%,并在多个训练迭代中保持性能提升,促进图像密集型领域的AI/ML模型开发。

DocSpiral: An Integrated Assistive Document Annotation Platform through Human-Machine Collaboration

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z
宣布SAP Databricks在AWS上的正式发布

SAP Databricks已在AWS上正式推出,作为SAP Business Data Cloud的全托管服务,简化了AI和分析流程,支持企业在SAP平台内直接处理数据。通过Delta Sharing,SAP数据可安全共享,支持多种AI/ML应用,提升数据利用效率。

宣布SAP Databricks在AWS上的正式发布

Databricks
Databricks · 2025-04-30T20:36:42Z
我在多伦多的第一次AWS用户组聚会:re:Invent回顾——多么难忘的经历!

AWS用户组多伦多首次聚会回顾了2024年AWS re:Invent大会,分享了云计算、AI/ML和数据库等最新动态。参与者积极提问,讨论热烈,展现了社区精神。未来将继续举办活动,欢迎更多人参与。

我在多伦多的第一次AWS用户组聚会:re:Invent回顾——多么难忘的经历!

DEV Community
DEV Community · 2025-04-16T19:27:46Z
黑客马拉松的疑虑

这是我在这个平台上的第一篇帖子,希望能获得关于AIML领域的创意,特别是黑客马拉松的点子。

黑客马拉松的疑虑

DEV Community
DEV Community · 2025-04-11T18:57:55Z
CNCF研究揭示云原生技术如何重塑全球商业与创新

一项研究显示,云原生技术的采用率已达89%,安全关注点转向协作与效率。Kubernetes仍是行业标准,80%的组织在生产中使用。CI/CD的采用增长了31%,加速了软件交付。AI/ML在Kubernetes上的应用仍处于初期阶段,但未来有望推动创新。

CNCF研究揭示云原生技术如何重塑全球商业与创新

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2025-04-01T08:00:00Z
下一代技术

通过AI/ML、云计算、机器人流程自动化和数据可视化等先进数字服务,提高企业在快速变化的数字环境中的效率与创新能力,保持竞争力。

下一代技术

DEV Community
DEV Community · 2025-03-17T04:08:37Z
我们对于 GPU 的看法错了 [译]

Kurt Mackey探讨了在构建公共云服务时对GPU的反思。尽管AI/ML的重要性被低估,市场对GPU的需求未能得到满足,开发者更倾向于使用API而非自行搭建GPU环境。尽管投入巨大,最终发现GPU并非主流需求,安全性和开发者体验变得更加重要。

我们对于 GPU 的看法错了 [译]

宝玉的分享
宝玉的分享 · 2025-02-17T05:11:42Z
AI/ML工作流程中10个必知的开源平台工程工具

构建和交付AI/ML解决方案的速度至关重要,但基础设施复杂性和低效性带来了挑战。平台工程通过内部开发平台(IDP)简化工作流程,自动化重复任务,提高开发效率。2024年Dora报告显示,平台工程可提升部署频率60%、开发者生产力8%和团队表现10%。推荐的开源工具包括KitOps、Kubeflow和DVC等,助力简化AI/ML项目流程。

AI/ML工作流程中10个必知的开源平台工程工具

DEV Community
DEV Community · 2025-02-06T16:35:09Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码