這一兩年Spark技術很火,自己也湊熱鬧,反複的試驗、研究,有痛苦萬分也有欣喜若狂,抽空把這些整理成文章共享給大家。這個系列基本上圍繞了Spark生态圈進行介紹,從Spark的簡介、編譯、部署,再到程式設計模型、運作架構,最後介紹其元件SparkSQL、Spark Streaming、Spark MLib和Spark GraphX等。文章内容的整理一般是先介紹原理,随後是實戰例子,由于面向的是入門讀者,在實戰中多截圖,還請諒解。為了大家實驗友善,在這裡把實驗相關的測試資料和安裝包放在百度盤提供 連結: https://pan.baidu.com/s/1i67cLsp 密碼: 778w。
本系列部落格在部落格園和CSDN首發,位址為:
以下為該系列文章清單:
本文轉自shishanyuan部落格園部落格,原文連結:http://www.cnblogs.com/shishanyuan/p/4699644.html ,如需轉載請自行聯系原作者