本文介绍如何使用 Amazon EMR 和 Apache Paimon 构建流式数据湖,包括创建支持 Paimon 的集群、流式摄取数据、数据打宽、应用层数据流式写入和使用 Spark 进行数据查询。Paimon 具有独特的功能优势,并且能和 Amazon EMR 中的 Flink、Spark、Hive 组件,Athena Spark 以及 Amazon S3 等协同工作。
完成下面两步后,将自动完成登录并继续当前操作。