天天看點

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

本次作業要求來自:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223

1.安裝Linux,MySql

2.windows 與 虛拟機互傳檔案

3.安裝Hadoop

還不能從windows複制檔案的,可在虛拟機裡用浏覽器下載下傳安裝檔案,課件:

提取檔案:hadoop-2.7.1.tar.gz

連結: https://pan.baidu.com/s/1HIVd9JCZstWm0k7sAbXQCg

提取碼: 2thj

這裡使用vmware workstation進行安裝具體步驟見https://zhuanlan.zhihu.com/p/38797088

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置
  • 安裝mysql成功
安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置
  • mysql啟動成功
安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置
  • 測試資料庫
安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

2共享檔案

安裝 vmware tools

VMware下ubuntu與Windows實作檔案共享的方法

.

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

在本機建立Share作為共享檔案夾

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

在Vm虛拟機檢視實作了檔案共享

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

把Hadoop-2.7.1解壓到/usr/local

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

3安裝Hadoop

建立hadoop使用者首先打開ctrl+alt+t打開終端視窗,輸入如下指令建立新使用者

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

退出并用Hadoop登入

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

更新apt

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

 安裝SSH、配置SSH無密碼登陸

Ubuntu預設已安裝SSH client,此外還需要安裝SSH server

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

安裝後,使用ssh localhost按提示操作可以登入本機

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

為了友善設定無密碼登入

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置
安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

再次登入就可以無密碼了

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

檢視是否安裝成功

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

 安裝java環境

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

安裝成功

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

使用指令 gedit  ~/.bashrc 配置環境變量檔案.bashrc

注意:gedit提示找不到檔案的話

sudo apt-get update

sudo apt-get install gedit-gmate

sudo apt-get install gedit-plugins

sudo apt-get remove gedit

sudo apt-get install gedit

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

3.配置Java的環境變量,在檔案最前面或最後面添加如下一行(等号前後不能有空格),然後儲存退出

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置
安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

執行source ~/.bashrc讓環境變量立即生效。然後檢驗是否設定正确 java環境安裝成功

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

僞分布式配置

hadoop安裝雲盤下載下傳位址:驗證碼:2thj

通過win檔案共享下載下傳的hadoop安裝包到虛拟機中,若檔案共享不成功,可以在Ubuntu系統中下載下傳。倘若在Ubuntu系統無法使用雲盤下載下傳,可在win系統下載下傳完後發到qq郵箱,然後再Ubuntu系統中登入qq郵箱,然後在下載下傳。

進行前先确認hadoop可用

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

 修改共享的hadoop檔案名 修改檔案夾權限 檢查hadoop是否可用

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

Hadoop生态的配置

我的部落格https://www.cnblogs.com/MissDu/p/8831525.html

複制配置檔案代碼。

運作Hadoop單機模式的例子

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

運作成功後檢視 

Hadoop預設不會覆寫結果檔案,再次運作上面執行個體會提示錯誤,需要現将 ./output 删除

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

Hadoop僞分布式配置 

Hadoop 可以在單節點上以僞分布式的方式運作,Hadoop 程序以分離的 Java 程序來運作,節點既作為 NameNode 也作為 DataNode,同時,讀取的是 HDFS 中的檔案。

Hadoop 的配置檔案位于 /usr/local/hadoop/etc/hadoop/ 中,僞分布式需要修改2個配置檔案 core-site.xml 和 hdfs-site.xml 。Hadoop的配置檔案是 xml 格式.

修改配置檔案 core-site.xml:

通過 gedit 編輯會比較友善: 

gedit ./etc/hadoop/core-site.xml

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置
安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

修改配置檔案 hdfs-site.xml:

gedit ./etc/hadoop/hdfs-site.xml

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

檔案配置完成後,執行 NameNode 的格式化

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

開啟NameNode和DataNode

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

通過jps指令判斷是否成功

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

運作Hadoop僞分布式執行個體

1.在 HDFS 中建立使用者目錄

2.建立目錄 input,其對應的絕對路徑就是 /user/hadoop/input

3.将 /usr/local/hadoop/etc/hadoop 複制到分布式檔案系統中的 /user/hadoop/input 中

4.檢視檔案清單

5.僞分布式運作 MapReduce 作業

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

運作

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

.檢視位于HDFS中的輸出結果并取回本地

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

關閉hadoop

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置

注意

下次啟動 hadoop 時,無需進行 NameNode 的初始化,隻需要運作 ./sbin/start-dfs.sh 開啟 NameNode 和 DataNode 守護程序就可以

安裝Hadoop VMware下ubuntu與Windows實作檔案共享的方法Hadoop生态的配置