天天看點

ECS伺服器搭建hadoop僞分布式

前提準備

1)阿裡雲ECS伺服器Centos7.5

2)Xshell或者其他和Linux互動的軟體(本文用的Bitvise SSH軟體)

我用的是Bitvise SSH

​​Bitvise SSH下載下傳​​

​​Bitvise SSH使用​​   裡面有講SSH軟體怎麼用

3)最好會vim操作(不會也沒問題)

不會的用軟體把需要修改的檔案下載下傳下到本地修改完畢後在上傳回去覆寫原來的檔案

4)hadoop-x.x.x.tar.gz   

我用的是  hadoop-2.7.2.tar.gz    ​​下載下傳2.7.2連結​​

5)一顆想着快照的心,一顆想着快照的心,一顆想着快照的心

搭建細節介紹

打算搭建之前請先快照一下

打算搭建之前請先快照一下

打算搭建之前請先快照一下

注意是在哪個路徑下進行一些操作

hadoop我安裝在    /opt/module    檔案下

我使用的是root使用者

如果你發現沒有某某檔案,就是你目前在的路徑不是對

寫的優點啰嗦,請注意閱讀

搭建流程

将ECS伺服器快照一下

建立快照

ECS伺服器搭建hadoop僞分布式

復原快照

ECS伺服器搭建hadoop僞分布式
ECS伺服器搭建hadoop僞分布式

用SSH軟體和ECS伺服器建立連接配接

(無法用語言表達)

安裝寶塔界面(寶塔面闆和Linux就和應用寶和手機的關系)

​​寶塔面闆官網​​    在官網最下面有各種Linux系統安裝寶塔的代碼

yum install -y wget && wget -O install.sh http://download.bt.cn/install/install_6.0.sh && sh install.sh      
ECS伺服器搭建hadoop僞分布式

中間有問你是否yes or no,安裝要求輸入yes或者y

ECS伺服器搭建hadoop僞分布式

到下面就顯示成功了,記住下面的url,賬号,密碼 

ECS伺服器搭建hadoop僞分布式

把上面的url打開并且輸入賬号密碼就出現下面的圖

在箭頭處可以修改賬号密碼

ECS伺服器搭建hadoop僞分布式

安裝jdk并且配置環境變量

選擇安裝tomcat就安裝好JDK了

ECS伺服器搭建hadoop僞分布式

jdk預設安裝的路徑是下圖

ECS伺服器搭建hadoop僞分布式

修改/etc/profile檔案,在最後,最後,最後加上下面的的java_home配置 

通過vim操作或者把檔案下載下傳下來修改在上傳覆寫

#JAVA_HOME
export JAVA_HOME=/usr/java/jdk1.8.0_121
export PATH=$PATH:$JAVA_HOME/bin      
ECS伺服器搭建hadoop僞分布式

讓修改後的檔案生效

[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# source /etc/profile      

檢視JDK是否安裝成功

java -version      
ECS伺服器搭建hadoop僞分布式

安裝hadoop并且配置環境變量

進入  /opt/ 下建立兩個檔案夾

[root@iZm5ea99qngm2v98asii1aZ opt]# cd /opt/
[root@iZm5ea99qngm2v98asii1aZ opt]# mkdir software
[root@iZm5ea99qngm2v98asii1aZ opt]# mkdir module
[root@iZm5ea99qngm2v98asii1aZ opt]#      
ECS伺服器搭建hadoop僞分布式

用軟體将hadoop-2.7.2.tar.gz檔案上傳到  /opt/software/   下

[root@iZm5ea99qngm2v98asii1aZ opt]# pwd
/opt
[root@iZm5ea99qngm2v98asii1aZ opt]# cd software/
[root@iZm5ea99qngm2v98asii1aZ software]# ls
hadoop-2.7.2.tar.gz
[root@iZm5ea99qngm2v98asii1aZ software]#      

将壓縮包解壓到   /opt/module/  下

tar -zxvf hadoop-2.7.2.tar.gz -C /opt/module/      
ECS伺服器搭建hadoop僞分布式

擷取hadoop安裝路徑  /opt/module/hadoop=2.7.2

[root@iZm5ea99qngm2v98asii1aZ module]# cd /opt/module/hadoop-2.7.2/
[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# pwd
/opt/module/hadoop-2.7.2
[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]#      
ECS伺服器搭建hadoop僞分布式

配置hadoop環境變量(修改 /etc/profile)(在最後加,和上面的配置JAVA_HOME一樣)

可以vim操作,可以将檔案下載下傳到本地修改完後在上傳覆寫原來的檔案

##HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-2.7.2
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin      

讓修改後的檔案生效

[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# source /etc/profile      

檢視hadoop是否安裝成功

[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# hadoop      
ECS伺服器搭建hadoop僞分布式

僞分布式運作模式

修改hadoop的配置檔案

修改/opt/module/hadoop-2.7.2/etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.8.0_121      
ECS伺服器搭建hadoop僞分布式

修改/opt/module/hadoop-2.7.2/etc/hadoop/core-site.xml

注意:hdfs://abcdefg:9000          abcdefg處填寫你的如下圖部分

ECS伺服器搭建hadoop僞分布式
<!-- 指定HDFS中NameNode的位址 -->
<property>
<name>fs.defaultFS</name>
    <value>hdfs://iZm5ea99qngm2v98asii1aZ:9000</value>
</property>

<!-- 指定Hadoop運作時産生檔案的存儲目錄 -->
<property>
    <name>hadoop.tmp.dir</name>
    <value>/opt/module/hadoop-2.7.2/data/tmp</value>
</property>      
ECS伺服器搭建hadoop僞分布式

修改/opt/module/hadoop-2.7.2/etc/hadoop/hdfs-site.xml

<!-- 指定HDFS副本的數量 -->
<property>
  <name>dfs.replication</name>
  <value>1</value>
</property>      
ECS伺服器搭建hadoop僞分布式

啟動叢集

進入/opt/module/hadoop-2.7.2目錄

[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# cd /opt/module/hadoop-2.7.2      

格式化NameNode(第一次啟動時格式化,以後就不要格式化)

[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# bin/hdfs namenode -format      

啟動NameNode

[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# sbin/hadoop-daemon.sh start namenode      

啟動DateNode

[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# sbin/hadoop-daemon.sh start datanode      

檢視是否啟動成功

[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# jps      
ECS伺服器搭建hadoop僞分布式

web端檢視HDFS檔案系統

1開放端口9000,50070

見下面常見問題

2 通路url

​​http://你的IP位址:50070/dfshealth.html#tab-overview​​

ECS伺服器搭建hadoop僞分布式

到這裡ECS搭建hadoop僞分布式已經搭建完畢

配置并啟動YARN

前提:

ECS伺服器搭建hadoop僞分布式

修改配置檔案

修改/opt/module/hadoop-2.7.2/etc/hadoop/yarn-env.sh

export JAVA_HOME=/usr/java/jdk1.8.0_121      

修改前

ECS伺服器搭建hadoop僞分布式

修改後

ECS伺服器搭建hadoop僞分布式

修改/opt/module/hadoop-2.7.2/etc/hadoop/yarn-site.xml

注意:第二value值是

ECS伺服器搭建hadoop僞分布式
<!-- Reducer擷取資料的方式 -->
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>

<!-- 指定YARN的ResourceManager的位址 -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>iZm5ea99qngm2v98asii1aZ</value>
</property>      
ECS伺服器搭建hadoop僞分布式

修改/opt/module/hadoop-2.7.2/etc/hadoop/mapred-env.sh

修改JAVA_HOME和上面修改操作一緻,不在重複

ECS伺服器搭建hadoop僞分布式

修改/opt/module/hadoop-2.7.2/etc/hadoop/mapred-site.xml(敲黑闆)

1)将mapred-site.xml.template重新命名為mapred-site.xml

進入 /opt/module/hadoop-2.7.2/etc/hadoop

[root@iZm5ea99qngm2v98asii1aZ hadoop]# cd /opt/module/hadoop-2.7.2/etc/hadoop      

對檔案重命名 

[root@iZm5ea99qngm2v98asii1aZ hadoop]# mv mapred-site.xml.template mapred-site.xml      

2)修改配置檔案mapred-site.xml

<!-- 指定MR運作在YARN上 -->
<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>      

修改後如圖所示 

ECS伺服器搭建hadoop僞分布式

啟動叢集

啟動前必須保證NameNode和DataNode已經啟動

傳回到/opt/module/hadoop-2.7.2目錄下

[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# cd /opt/module/hadoop-2.7.2      

啟動ResourceManager

[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# sbin/yarn-daemon.sh start resourcemanager      

啟動NodeManager

[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# sbin/yarn-daemon.sh start nodemanager      
ECS伺服器搭建hadoop僞分布式

開放8088端口

操作見最後常見問題

YARN的浏覽器頁面檢視

​​http://你的IP:8088/cluster​​

ECS伺服器搭建hadoop僞分布式

配置曆史伺服器

修改/opt/module/hadoop-2.7.2/etc/hadoop/mapred-site.xml

<!-- 曆史伺服器端位址 -->
<property>
<name>mapreduce.jobhistory.address</name>
<value>iZm5ea99qngm2v98asii1aZ:10020</value>
</property>
<!-- 曆史伺服器web端位址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>iZm5ea99qngm2v98asii1aZ:19888</value>
</property>      
ECS伺服器搭建hadoop僞分布式

啟動曆史伺服器

注意: 在  /opt/module/hadoop-2.7.2   下

[root@iZm5ea99qngm2v98asii1aZ hadoop-2.7.2]# sbin/mr-jobhistory-daemon.sh start historyserver      
ECS伺服器搭建hadoop僞分布式

 開放19888端口

見下面常見問題

檢視JobHistory

​​http://你的IP:19888/jobhistory​​

ECS伺服器搭建hadoop僞分布式

編寫啟動腳本

cd /opt/module/hadoop-2.7.2
sbin/hadoop-daemon.sh start namenode
sbin/hadoop-daemon.sh start datanode
sbin/yarn-daemon.sh start resourcemanager
sbin/yarn-daemon.sh start nodemanager
sbin/mr-jobhistory-daemon.sh start historyserver      

常見問題

忘記ECS伺服器密碼

更多--》修改密碼

ECS伺服器搭建hadoop僞分布式

開放端口(兩處都要修改)

1 在阿裡雲界面修改安全組開放端口

繼續閱讀