天天看點

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

1. Standalone模式

      即獨立模式,自帶完整的服務,可單獨部署到一個叢集中,無需依賴任何其他資源管理系統。從一定程度上說,該模式是其他兩種的基礎。借鑒Spark開發模式,我們可以得到一種開發新型計算架構的一般思路:先設計出它的standalone模式,為了快速開發,起初不需要考慮服務(比如master/slave)的容錯性,之後再開發相應的wrapper,将stanlone模式下的服務原封不動的部署到資源管理系統yarn或者mesos上,由資源管理系統負責服務本身的容錯。目前Spark在standalone模式下是沒有任何單點故障問題的,這是借助zookeeper實作的,思想類似于Hbase master單點故障解決方案。将Spark standalone與MapReduce比較,會發現它們兩個在架構上是完全一緻的: 

  1)  都是由master/slaves服務組成的,且起初master均存在單點故障,後來均通過zookeeper解決(Apache MRv1的JobTracker仍存在單點問題,但CDH版本得到了解決); 

2) 各個節點上的資源被抽象成粗粒度的slot,有多少slot就能同時運作多少task。不同的是,MapReduce将slot分為map slot和reduce slot,它們分别隻能供Map Task和Reduce Task使用,而不能共享,這是MapReduce資源利率低效的原因之一,而Spark則更優化一些,它不區分slot類型,隻有一種slot,可以供各種類型的Task使用,這種方式可以提高資源使用率,但是不夠靈活,不能為不同類型的Task定制slot資源。總之,這兩種方式各有優缺點。

Spark Standalone部署配置---Standalone架構

            

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

Spark Standalone部署配置---手工啟動一個Spark叢集

   這裡,我帶大家,看官網

<a href="http://spark.apache.org/docs/latest">http://spark.apache.org/docs/latest</a>

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

<a href="http://spark.apache.org/docs/latest/spark-standalone.html">http://spark.apache.org/docs/latest/spark-standalone.html</a>

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

  這裡,我不多說,自行去看吧!

Spark Standalone部署配置---通路web ui

● 通路http://master:8080/(預設端口是8080,端口大家可以自己修改)

Job送出與運作---運作示例程式

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)
Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)
Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

● Standby masters with Zookeeper

● Single-Node Recover with Local File System

  但是,這裡需。關于zookeeper的安裝

  我這裡不多說,請移步

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)
Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)
Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)
Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

 或者

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)
Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)
Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

   

                

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

Spark Standalone運作架構解析---Spark基本工作流程

  以SparkContext為程式運作的總入口,在SparkContext的初始化過程中,Spark會分别建立DAGScheduler作業排程和TaskScheduler任務排程兩級排程子產品。

  其中作業排程子產品是基于任務階段的高層排程子產品,它為每個Spark作業計算具有依賴關系的多個排程階段(通常根據shuffle來劃分),然後為每個階段建構出一組具體的任務(通常會考慮資料的本地性等),然後以TaskSets(任務組)的形式送出給任務排程子產品來具體執行。而任務排程子產品則負責具體啟動任務、監控和彙報任務運作情況。

Spark Standalone運作架構解析---Spark local模式

  Local,本地模式,預設情況是本地模式運作,如運作的spark-shell,開發測試環境,運作任務指令:

                    

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

   LocalBackend響應Scheduler的receiveOffers請求,根據可用的CPU核的設定值[N]直接生成CPU資源傳回給Scheduler,并通過Executor類線上程池中依次啟動和運作Scheduler傳回的任務清單,其核心事件循環由内部類LocalActor以Akka Actor的消息處理形式來實作。

Spark Standalone運作架構解析---Spark local cluster模式

僞分布式模式啟動兩個Worker,每個Worker管理兩個CPU核和1024MB的記憶體

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

   LocalBackend響應Scheduler的receiveOffers請求,根據可用的CPU核的設定值[N]直接生成CPU資源傳回給Scheduler,并通過Executor類線上程池中依次啟動和運作Scheduler傳回的任務清單,其核心事件循環由内部類LocalActor以Akka Actor的消息處理形式來實作

Spark Standalone運作架構解析---Spark standalone模式

        

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

Spark Standalone運作架構解析---Spark standalone詳細過程解析

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

 Spark Standalone 下運作wordcount

 具體,請移步

● wordcount代碼

● mvn 項目打包上傳至Spark叢集。

● Spark 叢集送出作業

  

Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)
Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)
Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)
Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)
Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)
Spark standalone簡介與運作wordcount(master、slave1和slave2)hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝)Spark程式設計環境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(部落客強烈推薦)

本文轉自大資料躺過的坑部落格園部落格,原文連結:http://www.cnblogs.com/zlslch/p/6628764.html,如需轉載請自行聯系原作者

繼續閱讀