hadoop分布式快速搭建

2013-08-01 23:50:00

hadoop分布式快速搭建

1.配置主節點與從節點的ssh互信；

【其中在主從節點主機的/etc/hosts檔案中需綁定主機名ip間的映射關系;

如,192.168.1.113 node0

192.168.1.108 node1

192.168.1.190 node2

】

2.配置各節點jdk環境;

3,修改${HADOOP_HOME}/conf/hadoop-env.xml,core-site.xml,hdfs-site.xml,mapred-site.xml;如下

修改core-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>hadoop.tmp.dir</name>

<value>/root/app/hadoop/hadooptmp</value>

</property>

<name>fs.default.name</name>

</configuration>

修改hdfs-site.xml

<name>dfs.replication</name>

修改mapred-site.xml

<name>mapred.job.tracker</name>

上面是主節點配置,拷貝主節點hadoop主目錄到從節點即可

4.在主節點格式化namenode檔案系統;

hadoop namenode -format

啟動hadoop即可;

狀态檢視

案例測試,

單詞統計,

hadoop fs -ls

touch file01 file02

echo hello hadoop file01

echo hadoop hi

hadoop fs -put ./* input

切換到${HADOOP_HOME}下執行

hadoop jar hadoop-xample.jar wordcount input output

hadoop fs -ls output

注意點;

hadoop分布式系統2個重要的目錄結構,一個是namenode上名字空間的存放,一個是datanode資料塊存放,還有其他的檔案存放,這些檔案的存放都是基于hadoop.tmp.dir存儲的.

namenode的名字空間存放位置

${hadoop.tmp.dir}/dfs/name

datanode資料塊的存放位置

${hadoop.tmp.dir}/dfs/data

hadoop.tmp.dir目錄可以不存在,hadoop系統會自動生成,

core-site.xml 檔案fs.default.name設定namenode位于哪個機器上,

格式hdfs://node0:90000

mapred-site.xml檔案mapred.job.tracker指定jobtracker位于那台機器上.

6大程序;

namenode,datanode,jobtracker,tasktracker,secondarynamenode,jps;

問題warning:$HADOOP_HOME is deprecated

解決，編輯/etc/profile

添加export HADOOP_HOME_WARN_SUPPRESS=TRUE

hadoop分布式快速搭建

繼續閱讀

大資料技術原理與應用（最後三天備考了！！！）

Hadoop FSDataInputStream 和FSDataOutputStream 用法

Windows下Cygwin環境的Hadoop安裝（3）- 運作hadoop中的wordcount執行個體遇到的問題和解決方法

MapReduce運作Wordcount時一直卡在INFO mapreduce.Job: Running job，web檢視一直處于accepted階段

ubuntu hadoop2.6.1，terminal下運作wordcount

MapReduce(一)：入門級程式wordcount及其分析

hadoop操作遇到的問題問題一：輸出檔案已存在

Hadoop之運作wordcount

jdk1.7+Eclipse+Maven3.5+Hadoop2.7.3建構hadoop項目

Eclipse運作WordCount（詳細版）相關連接配接Eclipse運作WordCount

hadoop 用MR實作join操作

Centos7 下 Hadoop 2.6.4 分布式叢集環境搭建摘要叢集準備安裝JDK 安裝 Hadoop 2.6.4 部署 slaver1-slaver4 啟動 hadoop 叢集成功了

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

ubuntu14.04下安裝hbse1.0.1.1

User Defined Hadoop DataType

Ambari介紹和架構原理