小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
2026年5月版:新动态

Redis推出了新功能Redis Iris,旨在解决AI代理的上下文问题并提供实时数据支持。Redis 8.8版本带来了性能提升,支持新数据结构并增强流处理能力。此外,数据集成1.18增加了Flink处理器和Snowflake支持,提升了数据吞吐量。同时,Redis软件现支持基于证书的身份验证,简化了访问管理。

2026年5月版:新动态

Redis Blog
Redis Blog · 2026-05-29T00:00:00Z
Redis 8.4中的XREADGROUP CLAIM实现单次可靠消费者

Redis 8.4引入了XREADGROUP的新CLAIM参数,简化了消息恢复过程。该命令可以同时回收闲置的待处理消息并读取新消息,提升了处理效率,支持自愈消费者的构建,显著提高了吞吐量和响应速度,使流处理更可靠。

Redis 8.4中的XREADGROUP CLAIM实现单次可靠消费者

Redis Blog
Redis Blog · 2026-05-26T00:00:00Z
无需新硬件的软件解决方案可降低AI的能耗

AI对能源基础设施的压力显著。通过将数据处理从批处理转向实时流处理,可以有效降低AI能耗。批处理导致需求峰值,需要为高峰负载配置基础设施,而流处理则平滑负载,降低峰值需求。流处理技术如Apache Kafka已在金融、零售等行业广泛应用,能提高效率并减少能源浪费。虽然无法完全解决AI的能耗问题,但提供了一种快速、低投资的解决方案。

无需新硬件的软件解决方案可降低AI的能耗

The New Stack
The New Stack · 2026-05-15T16:00:00Z
Python中的高效数据处理:批处理与流处理管道解析

在编写数据管道代码前,需要选择批处理或流处理。批处理适合处理历史数据,适用于数据新鲜度要求低的场景;流处理则适合实时需求。选择时需考虑数据新鲜度、处理复杂性和操作能力。混合架构(如Lambda和Kappa)结合了两者的优点,适应不同场景。理解这两种模式有助于选择合适的解决方案。

Python中的高效数据处理:批处理与流处理管道解析

freeCodeCamp.org
freeCodeCamp.org · 2026-04-13T13:51:23Z

管道与过滤器架构模式将复杂处理分解为独立阶段,通过标准化通道传递数据。起源于1960年代的Unix,强调每个过滤器只关注输入和输出,促进了系统的独立开发与测试。本文探讨了Unix管道的历史、形式化定义、设计模式及其在ETL和流处理中的应用,展示了管道模式的灵活性与高效性。

【系统架构设计】管道与过滤器:Unix 哲学的架构表达

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z

电商平台的风控系统需要在200毫秒内判断交易的欺诈风险,依赖用户下单频率、IP变化和设备指纹等数据。流处理相较于批处理能够实时计算,解决了无界数据流的挑战。文章探讨了流处理的精确一次语义及其工程难度,强调事件时间与处理时间的选择对结果的影响,以及水印机制和迟到数据的处理策略。同时,详细讨论了Flink的Checkpoint机制和状态管理,展示了流处理在实时数据管道中的重要性。

【系统架构设计】流处理架构:从批处理到实时的范式迁移

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z
什么是数据管道?

数据管道通过收集、处理和交付数据,解决数据孤岛问题,支持自动化、灵活性和实时分析。批处理适用于不需实时数据的场景,而流处理则用于需要即时反应的应用,如欺诈检测。数据管道架构包括数据收集、摄取、准备和消费,确保数据高效流动。

什么是数据管道?

Redis Blog
Redis Blog · 2026-03-30T00:00:00Z
S3 Tables 实战:两种方案,把 MySQL 数据实时”搬”进 S3 Tables

本文介绍了将MySQL变更数据实时同步到Amazon S3 Tables的两种方案:基于MSK Connect和Iceberg Kafka Connect的全托管方案,以及基于Flink CDC和Iceberg Dynamic Sink的流处理方案。S3 Tables提供自动表维护功能,简化了Iceberg数据湖的运维,支持高并发写入和优化查询性能。

S3 Tables 实战:两种方案,把 MySQL 数据实时”搬”进 S3 Tables

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-03-27T05:21:59Z
从混乱到规模:使用DLT-META对Spark声明式管道进行模板化

声明式管道通过意图驱动的方式构建批处理和流处理工作流,减少自定义代码,支持可重复的工程模式。随着数据使用的增长,管道数量增加,元编程通过结构化模板解决维护和一致性问题。DLT-META项目自动化管道创建,简化数据源添加和逻辑更新,提高开发效率和一致性。

从混乱到规模:使用DLT-META对Spark声明式管道进行模板化

Databricks
Databricks · 2026-01-07T22:45:00Z
消息代理基础知识:存储、复制与交付保障

消息代理是一种中间件,促进应用与服务之间的异步通信,解耦信息生产者与消费者,使其独立运作。它不仅是数据传输的管道,还用于流处理和任务分配,能够引入时间缓冲,防止流量高峰影响下游服务。

消息代理基础知识:存储、复制与交付保障

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-01-01T16:33:32Z
重新定义批处理:工作流编排为何与流处理同样现代

批处理是现代工作流编排的核心,支持关键业务和AI工作负载。它与流处理互补,选择处理方式应基于业务需求,而非技术趋势。

重新定义批处理:工作流编排为何与流处理同样现代

BMC Software | Blogs
BMC Software | Blogs · 2025-12-15T13:18:01Z

Microsoft Orleans在构建现代分布式应用时提供了定时任务和流处理机制。定时任务包括轻量级计时器和持久化提醒,适用于不同场景;流处理基于发布-订阅模式,支持实时数据处理。合理选择机制和优化策略可构建高效、可靠的分布式系统。

掌握Orleans高级特性:计时器、提醒与流处理详解

dotNET跨平台
dotNET跨平台 · 2025-12-13T00:06:12Z
什么是流处理?

流处理是一种实时数据管理方法,持续分析数据流,适用于需要即时反馈的应用,如金融欺诈检测和实时分析。它提高了应用响应速度,但不适合数据以批量形式到达的情况。

什么是流处理?

Redis Blog
Redis Blog · 2025-12-12T00:00:00Z
什么是实时AI?实时AI的架构及应用场景

实时AI系统需在毫秒级别快速处理数据并作出决策,广泛应用于高频交易、自动驾驶和机器人技术等领域。其架构依赖边缘计算、流处理和高效硬件,以确保低延迟和高效能。同时,模型优化和监控对系统的高效运行和及时更新至关重要。

什么是实时AI?实时AI的架构及应用场景

实时互动网
实时互动网 · 2025-11-25T02:58:36Z
无盘运行Kafka的优势:如何在大规模环境中实现变革

Apache Kafka是流处理应用的常用工具,80%的财富100强企业在使用。面对高数据量时,成本和复杂性问题突出。Kafka社区提出三项改进提案,其中KP-1150建议使用对象存储替代本地磁盘,以降低成本并提升灵活性。

无盘运行Kafka的优势:如何在大规模环境中实现变革

The New Stack
The New Stack · 2025-11-04T22:00:03Z
基于华为开发者空间-云开发环境Docker+Flink实现大数据实时统计系统

Apache Flink是一个开源流处理框架,支持实时和批处理,适用于数据清洗、监测和推荐。文章介绍了在云主机上安装Docker和Flink的步骤,以及使用CodeArts IDE进行实时数据统计的开发,预计耗时60分钟,适合企业、开发者和学生。

基于华为开发者空间-云开发环境Docker+Flink实现大数据实时统计系统

华为云官方博客
华为云官方博客 · 2025-10-20T01:54:01Z
Intuit的Numaflow为机器学习工程师抽象化基础设施

Numaflow是一个基于Kubernetes的开源流处理引擎,旨在简化数据处理管道的构建,支持Kafka、Pulsar和SQS,适合高吞吐量工作负载。它隐藏基础设施细节,使机器学习工程师专注于流处理逻辑,并能自动扩展以应对流量变化。

Intuit的Numaflow为机器学习工程师抽象化基础设施

The New Stack
The New Stack · 2025-10-06T14:00:54Z
为什么Python数据工程师应该了解Kafka和Flink

现代数据平台需要实时上下文以提取洞察。Python在数据工程中占主导地位,结合Apache Kafka和Flink,工程师能高效处理流数据。Python生态系统支持多种数据框架,使工程师能在熟悉的语法中构建数据管道。通过PyFlink和Kafka客户端,Python开发者可轻松实现企业级流处理。

为什么Python数据工程师应该了解Kafka和Flink

The New Stack
The New Stack · 2025-10-01T15:00:50Z
构建可扩展的文档处理管道:使用LlamaParse、Confluent Cloud和MongoDB

随着数据量的增加,从非结构化文档中提取有意义的见解变得更加困难。本文介绍了一种结合云存储、流处理、机器学习和数据库的先进架构,以构建高效的文档处理管道,满足现代企业对实时处理的需求。

构建可扩展的文档处理管道:使用LlamaParse、Confluent Cloud和MongoDB

MongoDB
MongoDB · 2025-09-10T14:00:00Z
Apache Kafka 4.1:开发者需要了解的三大要点

Apache Kafka 4.1 版本增强了实时数据架构,新增灵活的消息处理模式、现代认证标准和更强的流处理能力。KIP-932 引入共享消费组,支持多个消费者处理同一主题消息;KIP-1139 支持 JWT 认证,简化安全管理;KIP-1071 改进 Kafka Streams 的再平衡协议,提升任务可见性。此外,还改进了事务处理和统一指标命名。

Apache Kafka 4.1:开发者需要了解的三大要点

The New Stack
The New Stack · 2025-09-08T17:00:37Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码