HadoopHA搭建（簡版）

前言

剛搭建完叢集把以前的問題都給解決了，十分激動，于是寫下了第一篇部落格，由于之前不了解叢集的各節點分工及配置什麼的，導緻叢集搭建過程中錯誤頻出，後來看log日志檔案并且重新配置了一遍才成功，報錯了記得一定一定一定要看log檔案

準備工作

zookeeper叢集已經搭建并且配置完畢，bin/zkServer.sh status之後狀态為follower或者leader，了解每個節點的任務和工作，叢集共有四台機器：M1 M2 S1 S2

配置檔案的修改

HadoopHA在zookeeper叢集的基礎上修改hdfs-site.xml和core-site.xml兩個檔案就可以了

hdfs-site.xml

<configuration>
   <property>
        <name>dfs.nameservices</name>
        <value>mycluster</value>
   </property>
   <property>
        <name>dfs.ha.namenodes.mycluster</name>
        <value>nn1,nn2</value>
   </property>
   <property>
        <name>dfs.namenode.rpc-address.mycluster.nn1</name>
        <value>M1:8020</value>
   </property>
   <property>
        <name>dfs.namenode.rpc-address.mycluster.nn2</name>
        <value>M2:8020</value>
   </property>
   <property>
        <name>dfs.namenode.http-address.mycluster.nn1</name>
        <value>M1:50070</value>
   </property>
   <property>
        <name>dfs.namenode.http-address.mycluster.nn2</name>
        <value>M2:50070</value>
   </property>
   <property>
        <name>dfs.namenode.shared.edits.dir</name>
        <value>qjournal://S1:8485;S2:8485;M2:8485/mycluster</value>
   </property>
   <property>
        <name>dfs.client.failover.proxy.provider.mycluster</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
   </property>
   <property>
        <name>dfs.permission.enable</name>
        <value>false</value>
   </property>
   <property>
        <name>dfs.ha.fencing.methods</name>
        <value>
         sshfence
         shell(/bin/true)
        </value>
   </property>
   <property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>/root/.ssh/id_rsa</value>
   </property>
    <property>
        <name>dfs.ha.automatic-failover.enabled</name>
        <value>true</value>
    </property>
</configuration>

core-site.xml

<configuration>
   <property>
       <name>fs.defaultFS</name>
       <value>hdfs://mycluster</value>
   </property>

   <property>
        <name>dfs.journalnode.edits.dir</name>
        <value>/opt/HA/data/tmp/jn</value>
   </property>
   <property>
       <name>hadoop.tmp.dir</name>
       <value>/opt/HA/data/tmp</value>
   </property>
   <property>
        <name>ha.zookeeper.quorum</name>
        <value>M1:2181,S1:2181,S2:2181</value>
   </property>
</configuration>

啟動叢集

首先要啟動zookeeper叢集，在zookeeper中初始化HA的狀态，進入zookeeper安裝路徑下執行指令：

/bin/zkfc -formatZK

注意：namenode格式化一次後如果再次格式化，需删除

/opt/HA/data/tmp

目錄下的dfs檔案，否則将會報錯，再次格式化時需啟動journalNode節點，同時關閉叢集，以上操作完在主節點上啟動叢集：

/opt/hadoop/hadoop-2.9.sbin/start-dfs.sh

然後jps就能夠看到啟動的程序。

HadoopHA官網配置連結: https://hadoop.apache.org/docs/r2.9.2/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithNFS.html

HadoopHA搭建（簡版）HadoopHA搭建（簡版）

HadoopHA搭建（簡版）

前言

準備工作

配置檔案的修改

啟動叢集

繼續閱讀

大資料技術原理與應用（最後三天備考了！！！）

Hadoop FSDataInputStream 和FSDataOutputStream 用法

Windows下Cygwin環境的Hadoop安裝（3）- 運作hadoop中的wordcount執行個體遇到的問題和解決方法

MapReduce運作Wordcount時一直卡在INFO mapreduce.Job: Running job，web檢視一直處于accepted階段

ubuntu hadoop2.6.1，terminal下運作wordcount

MapReduce(一)：入門級程式wordcount及其分析

hadoop操作遇到的問題問題一：輸出檔案已存在

Hadoop之運作wordcount

jdk1.7+Eclipse+Maven3.5+Hadoop2.7.3建構hadoop項目

Eclipse運作WordCount（詳細版）相關連接配接Eclipse運作WordCount

hadoop 用MR實作join操作

Centos7 下 Hadoop 2.6.4 分布式叢集環境搭建摘要叢集準備安裝JDK 安裝 Hadoop 2.6.4 部署 slaver1-slaver4 啟動 hadoop 叢集成功了

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

ubuntu14.04下安裝hbse1.0.1.1

User Defined Hadoop DataType

Ambari介紹和架構原理