Spark叢集獨立模式HA

2017-11-22 23:50:00

一、Spark簡介：

Spark是一種與Hadoop相似的開源叢集計算環境

Spark基于MR算法實作的分布式計算，擁有Hadoop MR的優點，不同的是結果儲存在記憶體中

Spark是一個針對超大資料集合的低延遲的叢集分布式計算系統，比MapReduce快40倍左右

Spark是在 Scala 語言中實作的，它将 Scala 用作其應用程式架構

Spark相容Hadoop的API，能夠讀寫Hadoop的HDFS HBASE 順序檔案等

傳統的hadoop

Spark

環境概述：

192.168.1.2 master

192.168.1.3 worker

192.168.1.4 worker

二、Scala環境設定

<code>[root@master ~]</code><code># tar zxvf scala-2.10.4.tgz -C /home/hadoop/</code>

<code>[root@master ~]</code><code># cd /home/hadoop/</code>

<code>[root@master hadoop]</code><code># ln -s scala-2.10.4 scala</code>

<code>[root@master ~]</code><code># chown -R hadoop.hadoop /home/hadoop/</code>

<code># Scala</code>

<code>export</code> <code>SCALA_HOME=</code><code>/home/hadoop/scala</code>

<code>export</code> <code>PATH=$PATH:$HADOOP_DEV_HOME</code><code>/sbin</code><code>:$HADOOP_DEV_HOME</code><code>/bin</code><code>:$SCALA_HOME</code><code>/bin</code>

<code>[root@master hadoop]</code><code># source /home/hadoop/.bashrc </code>

<code>[root@master hadoop]</code><code># su - hadoop</code>

<code>[hadoop@master ~]$ scala</code>

<code>Welcome to Scala version 2.10.4 (Java HotSpot(TM) 64-Bit Server VM, Java 1.7.0_25 ).</code>

本文轉自ljl_19880709 51CTO部落格，原文連結：http://blog.51cto.com/luojianlong/1622837，如需轉載請自行聯系原作者

Spark叢集獨立模式HA

繼續閱讀

極大似然法(ML)與最大期望法(EM)

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

9.spark Core 進階2--Cashe

大資料排錯SparkSpark叢集啟動時候，JAVA_HOME is not sethadoop叢集，某台伺服器jps無任何輸出IDEAkafkahadoopspark sqlfile permissionsIDEA本地測試 - OutOfMemoryError: GC overhead limit exceededhdfs負載均衡

C++ 第十五周報告1--《冒泡法排序》

ubuntu14.04下安裝hbse1.0.1.1

筆試面試題目：滑動視窗(二)

User Defined Hadoop DataType

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method

hdu7108哈希