亚马逊AWS官方博客 ·

Amazon MSK 基于 S3 的数据导出、导入、备份、还原、迁移方案

💡 原文中文，约18300字，阅读约需44分钟。

📝

内容提要

本文介绍了在EC2上安装和配置Kafka Connect，创建Topic和S3存储桶，制作带有S3 Sink Connector和S3 Source Connector的Kafka Connect镜像，并测试验证了以S3为中转媒介的MSK数据导出、导入、备份、还原链路的正常工作。提供了清理操作。

🎯

关键要点

Amazon MSK 是 Amazon 提供的托管 Kafka 服务，支持数据导出和导入。
在网络受限或账号隔离的情况下，使用 Kafka Connect S3 Source/Sink Connector 是合适的选择。
本文提供了一套基于 Docker 的 Kafka Connect 解决方案，用户只需设置环境变量并执行脚本。
导出/导入和备份/还原是两种相似的场景，本文将分别讨论。
需要准备一台 Amazon Linux2 的 EC2 实例和两个 MSK 集群，确保网络连通性。
全局配置脚本用于集中配置与环境相关的信息，确保脚本的可移植性。
在 EC2 上安装 jq、yq、docker、jdk 和 kafka-console-client 等工具包。
创建 S3 存储桶用于数据转储，确保 Source 和 Sink Topics 的分区数一致。
制作带有 S3 Sink Connector 和 S3 Source Connector 的 Kafka Connect 镜像。
配置并启动 Kafka Connect，使用 JsonConverter 作为消息转换器。
配置并启动 S3 Sink Connector 和 S3 Source Connector，确保数据流动正常。
通过监控 Source 和 Sink Topics 验证数据导入导出是否成功。
提供清理操作的脚本，以恢复初始状态。
方案定位于轻便易用，支持根据需要调整性能相关配置，且可迁移到 Kubernetes 或 Amazon MSK Connect。

🏷️

标签

Kafka Connect MSK S3 数据备份数据导出

➡️

继续阅读

江波龙将携端侧AI存储方案参展FMS 2026
(全球TMT 2026年07月27日讯)美国硅谷当地时间2026年8月4日至6日，FMS2026将在美国加州启 […]
迅策科技与深开鸿将围绕鸿蒙全生态数据Token化展开深度合作
(全球TMT 2026年07月27日讯)7月26日，迅策科技发布公告，宣布其与深圳开鸿数字产业发展有限公司（深 […]
动态 IP 场景下的 Site-to-Site VPN组网方案
在企业混合云组网中，AWS Site-to-Site VPN 是连接办公地点与 AWS 的常用方案。然而，当办公地点使用部分 ISP 接入时，公网 IP ...
Amazon Quick Desktop 企业 SSO 实战
本文介绍如何使用开源身份认证服务器 Keycloak 作为 IdP，通过 Amazon EC2 快速部署一套轻量级的 OIDC Provider，分别通过...
NAD+补充剂真能抗衰老？六十项临床数据揭开非线性响应真相
人类往身体里灌NAD+，就像给一台老电脑强行超频，但主板上的电容随时可能炸。八十多项临床研究、三十多项人体试验反复确认一件事：口服NAD+前体确实能把血...
Amazon EKS Adds Kubernetes Version Rollback within 7 Days of an Upgrade
Amazon EKS has recently introduced support for Kubernetes version rollbacks, ...