The New Stack ·

为什么我们在大规模实时数据处理中使用Apache Kafka

💡 原文英文，约1200词，阅读约需5分钟。

📝

内容提要

SecurityScorecard使用实时数据提供组织全面的安全状况视图。他们每天分析超过300种问题类型，识别200多亿个安全漏洞。他们采用Confluent Cloud和Confluent Platform进行数据流处理，构建了名为Horus的全球分布式系统。SecurityScorecard在流式基础设施成本上节省了200万美元。他们还使用Confluent进行数据治理和效率，使多个团队能够轻松共享和管理相同的源数据。迁移到Confluent Cloud简化了操作任务并降低了成本。SecurityScorecard实现了无与伦比的可扩展性，现在可以在10天内扫描超过2000个端口。他们计划利用Apache Flink进行进一步的增强。在构建流式数据管道时，建立及时性、使用模式、利用生态系统，并仅开发必要的部分是重要的。使用托管的数据流平台可以消除基础设施管理问题。

🎯

关键要点

SecurityScorecard使用实时数据提供组织全面的安全状况视图。
每天分析超过300种问题类型，识别200多亿个安全漏洞。
采用Confluent Cloud和Confluent Platform构建流式数据管道。
创建名为Horus的全球分布式系统，节省了200万美元的流式基础设施成本。
Horus使用实时流式管道和连接器处理数据，支持全球范围内的任务。
数据治理对SecurityScorecard至关重要，使用自定义的Protobuf库管理敏感数据访问。
Confluent的Stream Governance功能增强了数据治理和效率。
迁移到Confluent Cloud简化了操作任务，节省了约125,000美元的年度成本。
SecurityScorecard现在可以在10天内扫描超过2000个端口，提升了可扩展性。
在构建流式数据管道时，及时性、使用模式和生态系统的利用非常重要。

🏷️

继续阅读

您的大型语言模型问题实际上是数据问题
本文讨论了AI和大型语言模型（LLM）在处理实时结构化生产数据时的挑战。嘉宾Harsha Chintalapani指出，模式变化、不一致的定义和薄弱的治理...
亚马逊云科技大幅扩展与OpenAI的合作伙伴关系
亚马逊云科技宣布与OpenAI扩大合作，推出最新的OpenAI模型和编程Agent Codex，支持企业软件开发。新产品通过Amazon Bedrock提...
在日常设备上实现隐私保护的人工智能训练
麻省理工学院的研究人员开发了一种新方法，提升了联邦学习的效率，使其在资源有限的设备上更快地训练人工智能模型。该方法通过减少内存需求和通信负担，加速训练过程...
开放媒体联盟发布多边形网格编码标准参考软件
开放媒体联盟（AOMedia）发布了多边形网格编码（PMC）标准的参考软件，旨在提高3D物体的压缩效率，预计比现有技术提高20%至40%。该软件供开发者测...
亚马逊在产品页面上推出 AI 语音对话功能
亚马逊推出了新的AI功能“加入聊天”，用户可以实时向卖家提问并获得语音回复，旨在节省顾客时间并提供关键产品信息，模拟与实体店员工的对话体验。用户可通过“收...
MediaKind分享多视图部署最新进展
MediaKind的云原生多视图功能在北美持续扩展，Charter为2026年NCAA篮球锦标赛推出该服务，用户可同时观看多场比赛。该功能在“疯狂三月”期...

为什么我们在大规模实时数据处理中使用Apache Kafka

内容提要

关键要点

标签

继续阅读