天天看點

Kafka 資料源、Receiver 和 Direcet 方式接收資料_1|學習筆記

開發者學堂課程【大資料實時計算架構 Spark 快速入門:Kafka 資料源、Receiver 和 Direcet 方式接收資料_1】學習筆記,與課程緊密聯系,讓使用者快速學習知識。

課程位址:

https://developer.aliyun.com/learning/course/100/detail/1729

Kafka 資料源、Receiver 和 Direcet 方式接收資料_1

Receiver 接收資料,local[2] 說明需要占用獨立的線程資源,seconds(5) 說明每隔5 秒切割一個 RDD,每隔 5 秒送出一個 JOB,該 JOB 需要在 5 秒内算完,故需控制資料量。

線程數量為 1,由一個線程當 receiver 來接收 kafka 的資料。

Receiver 機制建立 DStream,zklist 是 zookeeper 的位置,WordcountConsumerGroup 是目前應用程式的名稱,KafkaParams 是 kafka 的相關内容。

flatmap 接收到一句話,由 tuple 轉化,split 切割後轉化為一個具體的值傳回到words。

繼續閱讀