雲上Hadoop的優勢
如果對E-Mapreduce有興趣,可以通路
E-Mapreduce教育訓練系列之基本介紹這裡主要是圍繞E-Mapreduce這款雲産品展開的。
易用
主要展現在叢集的建立、銷毀、擴容、縮容等方面,目前一個叢集基本4分鐘内開啟。支援作業的編排、作業執行錯誤後報警等。hadoop本身提供了基本的軟體,目前hue、zeppelin、ooize等雖然提供了網頁版本的互動式,任務的編排;但是畢竟不是企業的服務,也沒有提供高可用的保證,對于報警,跟組内其它同僚的賬戶也難以內建。emapreduce會提供這方面的服務,不過目前一些還在實作中。
低成本
主要展現線上下購買Hadoop、運維Hadoop叢集的高成本。在雲上有更好的組合方式,比如把資料放在OSS中,再啟動emr叢集按需運作。按照客戶的業務情況,對于一直hold資源的場景,可以包年包月,如果業務增長,可以彈性增加資源。對于每天幾個小時的ETL,可以按需運作,資料存放到OSS中。
深度整合
跟阿裡雲其它産品深度整合在一起,使用者不僅僅隻使用大資料系統,往往需要非常多的系統配合使用

在阿裡雲emr中,跟其它幾乎所有的資料存儲服務無縫內建在一起。
可靠
平台提供運維工具,一方面如果一些可以自動修複的場景會自動修複,比如:datanode挂了重新拉起。一些比如master壓力過大,則報警給客戶,再上來查詢。
安全
提供VPC的方式預設隔離其它使用者,提供安全組可以設定通路的政策,RAM提供父子賬号滿足資源權限的隔離。
專業
提供專家系統分析客戶執行作業的情況,比如好還是壞。專家服務可以提供大資料解決方案的咨詢及解決客戶的疑難雜症。
後記
這個是本系列的最後一篇,簡單講述了雲上的一些優勢。
其它雲上Hadoop之X系列見:
HBase技術交流社群- 阿裡官方“HBase生态+Spark社群大群”點選加入:
https://dwz.cn/Fvqv066s