The New Stack ·

OpenAI通过Fluent Bit优化回收了30,000个CPU核心

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

在2025年的KubeCon+CloudNativeCon上，OpenAI的Fabian Ponce强调了优化的重要性。他们通过Fluent Bit处理数据，发现fstatat64函数占用了35%的CPU。关闭该功能后，节省了约30,000个CPU核心，显著提升了资源效率。Ponce指出，分析性能瓶颈至关重要。

🎯

关键要点

在KubeCon+CloudNativeCon 2025上，OpenAI的Fabian Ponce强调了优化的重要性。
OpenAI通过Fluent Bit处理数据，发现fstatat64函数占用了35%的CPU。
关闭fstatat64功能后，节省了约30,000个CPU核心，显著提升了资源效率。
Fluent Bit在每个Kubernetes节点上运行，生成每天10PB的数据。
OpenAI对GPU的需求巨大，计划到年底使用超过100万个GPU。
使用perf工具分析Fluent Bit的CPU使用情况，发现性能瓶颈。
每次写入新文件时，Fluent Bit都会执行fstatat64，导致额外的计算消耗。
优化Fluent Bit后，团队能够在Kubernetes集群中释放更多的CPU资源。
Ponce建议定期使用性能分析工具，识别潜在的性能瓶颈。

❓

延伸问答

OpenAI在KubeCon+CloudNativeCon上分享了什么重要信息？

OpenAI强调了优化的重要性，特别是在处理大规模数据时的资源效率。

Fluent Bit在OpenAI的系统中扮演什么角色？

Fluent Bit作为观察平台，处理日志文件并生成每天10PB的数据。

OpenAI是如何节省CPU资源的？

通过关闭fstatat64函数，OpenAI节省了约30,000个CPU核心。

fstatat64函数对CPU使用有什么影响？

fstatat64函数占用了35%的CPU资源，导致额外的计算消耗。

OpenAI对GPU的需求有多大？

OpenAI计划到年底使用超过100万个GPU，并可能增加100倍。

Ponce对性能分析有什么建议？

Ponce建议定期使用性能分析工具，识别潜在的性能瓶颈。

🏷️

继续阅读

在人工智能代理时代，CPU为何仍然重要
文章讨论了CPU在人工智能基础设施中的重要性，特别是在聊天机器人向自主代理转变的过程中。Google的Farhat和Arm的Patel指出，CPU在任务执...
OpenAI是如何构建其数据代理的
OpenAI的数据平台存储了1.5 exabytes的数据，支持约4000名内部用户。为提高数据分析效率，OpenAI开发了一个数据代理，能够快速回答用户...
微软与OpenAI分道扬镳——现在他们准备好迎战了
微软在Build大会上宣布了一系列新的AI计划，包括自家开发的推理模型MAI-Thinking-1，旨在满足企业需求。此外，微软推出了集成多种AI助手的“...
OpenAI公共政策议程
OpenAI的使命是确保人工智能造福全人类，遵循民主化、赋权、普遍繁荣、韧性和适应性五项核心原则。OpenAI致力于与政府和社会合作，推动政策应对AI带来...
Free CPU教程丨西湖大学张岳团队开源科研插图神器AutoFigure，可精准理解长篇科学文本
西湖大学的张岳团队推出了智能科研插图生成系统AutoFigure，旨在解决高质量科研插图的生成难题。该系统基于长篇科学文本，确保插图的逻辑结构准确且视觉美...
记一次 .NET 某注塑模具系统 CPU爆高分析 - 一线码农
最近一位朋友遇到CPU使用率飙升的问题，分析dump文件后发现程序仅使用两个核心，导致负载过高。调查显示，GC触发是由于大对象堆（LOH）满，主要原因是将...