小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
从Spark SQL到Databricks的声明式管道

2013年,迈克尔·阿姆布鲁斯在Databricks开始开发Spark SQL。2023年,他宣布将两个平台技术开源至Apache Spark,显示Databricks对Spark的持续关注。Spark自2009年由Matei Zaharia创建,成为分布式机器学习平台。Databricks还开源了Declarative Pipeline和实时模式技术,以提升数据流处理能力,致力于保持开源基础并发展专有平台,增强市场竞争力。

从Spark SQL到Databricks的声明式管道

The New Stack
The New Stack · 2025-07-07T20:08:15Z
Go语言中的管道模式:实用指南

管道设计模式用于数据流处理,支持在不同处理单元间传递数据,形成灵活的处理系统。Go语言通过goroutines和channels自然支持该模式,适合并发任务和数据流,便于扩展和维护,广泛应用于并发数据处理和实时数据流场景。

Go语言中的管道模式:实用指南

DEV Community
DEV Community · 2025-05-25T00:24:51Z

数据流处理是实时处理生成数据的实践,适用于点击和交易等场景。利用Apache Kafka和Flink等工具,数据科学家能够构建实时分析和预测模型,提高决策效率。流处理与批处理互为补充,适合低延迟和高频率的应用,支持实时监控和持续学习。

数据科学家数据流处理指南

KDnuggets
KDnuggets · 2025-05-14T17:00:25Z
演讲:流处理的所有事物——有效数据流处理的模式

本文探讨了数据流处理的模式与挑战,强调在流处理系统中实现“精确一次”语义的重要性。作者介绍了从批处理到流处理的转变,连接Kafka与Flink的技术细节,以及数据完整性和错误恢复的处理方法。最后,讨论了AI集成对数据架构的影响,强调实时数据处理与机器学习的结合。

演讲:流处理的所有事物——有效数据流处理的模式

InfoQ
InfoQ · 2025-05-08T14:05:00Z
开发者在开始Apache Kafka之旅时应了解的事项

Apache Kafka在数据流处理中的应用面临学习曲线陡峭和操作挑战,许多团队因数据治理不足和资源管理困难而难以发挥潜力。建议从简单用例入手,关注基础概念,合理规划事件和数据架构,以提升效率和可靠性。

开发者在开始Apache Kafka之旅时应了解的事项

The New Stack
The New Stack · 2025-04-15T13:00:11Z
Google Cloud Pub/Sub:深入探讨

Google Cloud Pub/Sub是一个完全托管的实时消息服务,支持应用间的消息传递。通过主题和订阅实现事件驱动架构,具备可扩展性、可靠性和解耦特性,适用于实时分析和数据流处理等场景。

Google Cloud Pub/Sub:深入探讨

DEV Community
DEV Community · 2025-04-03T16:59:41Z
Amazon托管的Apache Flink服务

Amazon托管的Apache Flink服务是一个支持Java、Scala和SQL的数据流处理框架,适用于响应分析和ETL等场景。它能够访问多种AWS服务,提供计算资源、并行处理和自动扩展功能,并可与AWS Lambda结合,实现复杂的数据处理需求。

Amazon托管的Apache Flink服务

DEV Community
DEV Community · 2025-01-12T06:58:58Z
流动一切:Adi Polak在QCon旧金山探讨有效数据流处理的模式

Adi Polak在QCon旧金山会议上讨论了数据流处理的挑战与解决方案,强调理想的数据流系统应具备可靠性、低延迟和高数据质量。她介绍了设计模式,如死信队列(DLQ)和一次性处理协议,并探讨了数据完整性、错误处理及与AI应用的结合,强调高吞吐量和低延迟的重要性。

流动一切:Adi Polak在QCon旧金山探讨有效数据流处理的模式

InfoQ
InfoQ · 2024-11-29T10:00:00Z

技术招聘竞争激烈,掌握大公司常用的技术和创新应用能提升简历。文章介绍了几个开源库:Composio用于AI集成,Apache Kafka用于实时数据流处理,Grafana用于数据可视化,Celery用于任务队列,Selenium用于浏览器自动化,LlamaIndex用于AI应用,Pytorch Lightning用于深度学习,Posthog用于产品分析,Auth0用于身份验证。这些工具能帮助开发者在技术领域脱颖而出。

让你的简历脱颖而出的9个开源库 ⚡ 🚀

DEV Community
DEV Community · 2024-09-26T14:20:29Z
Databricks被评为流处理和云数据管道领域的领导者

Databricks被两份分析报告认可为数据工程和数据流处理领域的领导者。IDC报告强调实时数据的重要性,并将Databricks评为流处理工作负载的顶级平台。Forrester报告强调简单和自动化解决方案的需求,并认可Databricks作为构建数据管道的最佳平台。Databricks提供Delta Live Tables和Databricks Workflows等功能,用于高效的管道开发。该平台还支持数据工程和数据科学之间的协作。

Databricks被评为流处理和云数据管道领域的领导者

Databricks
Databricks · 2024-07-08T12:54:17Z
在北京/宁夏区部署 MSK 集群触发跨账号 Lambda 函数的架构

亚马逊云科技推荐企业客户采用Amazon MSK + Lambda的无服务器事件驱动处理架构,提供云原生优势。该架构支持Kafka API导入实时数据流到数据湖仓,具有资源弹性、数据流处理时效性和高并发波峰响应处理能力。同时提供后处理扩展能力,包括数据存储服务、安全控制、数据加密存储传输、监控告警日志以及机器学习和大数据分析应用。在中国大陆的北京/宁夏区域,暂未发布Lambda ESM for MSK功能,需采用Apache Kafka URL作为跨账号Lambda触发源实现跨账号的数据流处理架构。

在北京/宁夏区部署 MSK 集群触发跨账号 Lambda 函数的架构

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2024-05-07T07:41:26Z

本文介绍了使用Apache Kafka进行数据流处理的优势和应用场景,包括米其林和汉莎航空的案例。数据流可以实现解耦、领域驱动设计以及跨实时和批处理系统的数据一致性。Apache Kafka作为下一代中间件,具有实时消息传递、事件存储、数据集成和流处理等特点。汉莎航空利用Kafka构建了实时数据处理基础设施,并通过数据流解决了警报异常检测和飞机运营机队管理等挑战。航空业需要数字化的端到端供应链来提供良好的客户体验和竞争力。

米其林、汉莎航空使用Kafka数据流的案例

极道
极道 · 2023-11-27T00:05:00Z

本文介绍了数据流处理的三个阶段:收集、处理和呈现。收集阶段使用实时数据源,处理阶段使用开源流处理器进行实时分析,呈现阶段将数据写入流媒体平台等。

什么是数据工程中的流处理?

极道
极道 · 2023-10-21T00:05:00Z

Apache NiFi是一个开源的数据流处理和自动化工具。受影响版本中的多个Processors和Controller Services在配置JDBC和JNDI JMS连接时存在URL参数过滤不完全的漏洞,攻击者可以通过构造特定格式绕过连接URL验证,可能导致数据泄露等危害。漏洞影响范围为org.apache.nifi:nifi-nar-bundles@[1.21.0, 1.23.1),修复方案是升级组件org.apache.nifi:nifi-nar-bundles到1.23.1或更高版本。

【中危】 Apache NiFi 连接 URL 验证绕过漏洞 (CVE-2023-40037)

OSCS开源安全社区
OSCS开源安全社区 · 2023-08-22T02:29:33Z
pyspark streaming简介 和 消费 kafka示例

本文介绍了Spark Streaming的基础和高级数据源,包括通过socket和Kafka进行数据流处理的示例代码。基础数据源通过socket连接,展示了数据的读取与处理;高级数据源则整合Kafka,提供两种使用模式。

pyspark streaming简介 和 消费 kafka示例

郑文峰的博客
郑文峰的博客 · 2022-08-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码