本文記錄參考 http://dblab.xmu.edu.cn/blog/2775-2/ 搭建hadoop分布式叢集的過程
已在一台虛拟機配置好了僞分布式hadoop系統
一台虛拟機作為master作為namenode,三台虛拟機data1、2、3(均安裝了ubuntu系統)作為datanode
網卡1配置為NAT網絡,這樣虛拟機可以正常通路外部網絡
網卡2配置為host-only,這樣data虛拟機可以和master虛拟機通信

如果界面名稱顯示未指定,可以在virtualBox左上角菜單欄點選管理,主機網絡管理器,點選建立,便可以指定界面名稱
配置主機名稱和網絡
sudo vim /etc/hostname
ping data1 -c 3 測試網絡是否連通
必須要讓Master節點可以SSH無密碼登入到各個Slave節點上。首先,生成Master節點的公匙,如果之前已經生成過公鑰,必須要删除原來生成的公鑰,重新生成一次,因為前面我們對主機名進行了修改。具體指令如下
為了讓Master節點能夠無密碼SSH登入本機,需要在Master節點上執行如下指令:
cat ./id_rsa.pub >> ./authorized_keys
接下來,在Master節點将上公匙傳輸到Slave1節點(具體檔案夾視具體情況而定)
scp ~/.ssh/id_rsa.pub hadoop@Slave1:/home/hadoop/
在data1節點上,将SSH公匙加入授權:
如果有其他節點,一樣配置
在前面的僞分布式安裝内容中,已經介紹過PATH變量的配置方法。可以按照同樣的方法進行配置,這樣就可以在任意目錄中直接使用hadoop、hdfs等指令了。如果還沒有配置PATH變量,那麼需要在Master節點上進行配置。 首先執行指令“vim /.bashrc”,也就是使用vim編輯器打開“/.bashrc”檔案,然後,在該檔案最上面的位置加入下面一行内容:
export PATH=$PATH:/usr/local/hadoop/bin:/usr/local/hadoop/sbin
儲存後執行指令“source ~/.bashrc”,使配置生效。
在配置叢集/分布式模式時,需要修改“/usr/local/hadoop/etc/hadoop”目錄下的配置檔案,這裡僅設定正常啟動所必須的設定項,包括workers 、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml共5個檔案,更多設定項可檢視官方說明。檔案在/usr/local/hadoop/etc/hadoop中
workers
core-site.xml
hdfs-site.xml
mapred-site.xml
yarn-site.xml
5個檔案全部配置完成以後,需要把Master節點上的“/usr/local/hadoop”檔案夾複制到各個節點上
在master節點上:
在data1節點上
首次執行,在master節點上格式化節點:
啟動
在master上jps檢視
data1上檢視
在master虛拟機上
祝看到這裡的你生活愉快,謝謝