厦大数据库实验室博客 ·

第11章的代码-林子雨编著《大数据基础编程、实验和案例教程（第3版）》教材

💡 原文中文，约5400字，阅读约需13分钟。

📝

内容提要

《大数据基础编程、实验和案例教程（第3版）》是林子雨编著的一本教材，提供了命令行和代码示例，方便读者学习和使用。教材涵盖了数据采集工具的安装和使用，以及Kafka和Spark的代码示例。读者可以通过复制代码按钮将代码复制到其他地方使用。

🎯

❓

这本教材主要介绍大数据基础编程，包括命令行和代码示例，数据采集工具的安装和使用，以及Kafka和Spark的代码示例。

安装Kafka需要解压缩文件并启动Zookeeper和Kafka服务器，具体命令可参考教材第11章。

教材中提供了Kafka生产者和消费者的Scala代码示例，以及Spark Streaming的使用示例。

使用spark-submit命令时，需要指定类名和JAR文件路径，具体步骤可参考教材中的示例。

KafkaWordProducer类用于发送消息到Kafka主题，支持设置每秒发送的消息数量和每条消息的单词数量。

可以使用Spark Streaming创建直接流，从Kafka读取数据并通过RDD进行处理，具体代码示例在教材中有详细说明。

🏷️