接觸了Spark也快有半年了,版本從0.8.0到現在的1.0.0SNAPSHOT,從頭到尾被spark這個優秀的架構深深吸引,也為scala的優雅所折服。4.19日“2014 中國Spark技術峰會”召開,可以看出随着Spark技術的完善,越來越多的企業已經開始使用或開始關注Spark的發展了。回顧學習過程,覺得很有必要整理一份學習路線,對所學的内容加以沉澱,同時也為同行作為參考。
因為Spark1.0.0即将釋出,增加了很多特性,是以決定修改以前的博文,全都采用Spark1.0.0,計劃寫40-50篇左右的博文,盡量在7月底完成。
筆者在上提供了本人編譯的spark1.0.0-SNAPHOT的部署包,還提供了支援Tachyon0.4.1的部署包。實驗環境所涉及的軟體有:
1:原理篇
Spark1.0.0 on YARN 運作原了解析
Spark1.0.0 on Mesos 運作原了解析
Spark1.0.0 程式設計模型
Spark1.0.0 程式設計模型解析
Spark Streaming運作架構基本概念
2:運維篇
部署篇
Spark1.0.0 on Mesos 模式部署
監控篇
Spark1.0.0 UI監控解讀
用ganglia監控Spark1.0.0
優化篇
Spark1.0.0 性能調優
3:Spark生态環境
Spark1.0.0 生态環境簡介
Spark on SQL 簡介
4:Spark開發
5:源碼研讀
Spark1.0.0 源碼研讀環境搭建
一張圖看懂Spark源碼
6:雜記
在csdn上釋出一下這部落格,看看效果,如果好的話,将163.com上部落格搬過來。因為要修改的東西太多,有點猶豫不決。