啃掉Hadoop系列筆記(04)-Hadoop運作模式之僞分布式模式

2022-12-22 23:50:00

僞分布式模式等同于完全分布式，隻是她隻有一個節點。

一） HDFS上運作MapReduce 程式

（1）配置叢集

　　（a）配置：hadoop-env.sh

　　　　Linux系統中擷取jdk的安裝路徑：

　　　　修改JAVA_HOME 路徑：

　　（b）配置：core-site.xml

　　　　原始該檔案内容

　　　　配置後該檔案内容

　　（c）配置：hdfs-site.xml

　　　　該檔案原始内容

　　　　配置後該檔案内容

（2）啟動叢集

　　（a）格式化namenode（第一次啟動時格式化，以後就不要總格式化）

　　（b）啟動namenode

　　（c）啟動datanode

（3）檢視叢集

　　（a）檢視是否啟動成功

　　（b）檢視産生的log日志

　　（c）web端檢視HDFS檔案系統

　　　　在浏覽器中輸入 http://192.168.47.101:50070/

　　　　至此一個Hadoop的僞分布模式即搭建完成

（4）操作叢集

　　（a）在hdfs檔案系統上建立一個input檔案夾

　　　　進入Web檢視是否建立成功

　　（b）将測試檔案内容上傳到檔案系統上

　　（c）檢視上傳的檔案是否正确

　　（d）在Hdfs上運作mapreduce程式

　　（e）檢視輸出結果

　　　　指令行檢視：

　　　　浏覽器檢視

　　（f）将測試檔案内容下載下傳到本地

　　　　點選上一步浏覽器檢視中的part-r-00000

　　　　将 part-r-00000檔案下載下傳後檢視

　　（g）删除輸出結果

二） YARN上運作MapReduce 程式

（1）配置叢集

　　（a）配置yarn-env.sh

　　　　配置JAVA_HOME

　　（b）配置yarn-site.xml

　　　　增加兩個屬性節點

　　（c）配置：mapred-env.sh

配置JAVA_HOME

　　（d）配置： (對mapred-site.xml.template重新命名為) mapred-site.xml

并配置相應節點

（2）啟動叢集

啟動叢集之前先要保證namenode和datanode正常啟動

　　（a）啟動resourcemanager

　　（b）啟動nodemanager

（3）叢集操作

　　（a）yarn的浏覽器頁面檢視

啟動成功後在浏覽器中輸入對應位址可檢視

　　（b）執行mapreduce程式

　　（c）檢視運作結果

　　（d）删除檔案系統上的output檔案

三）修改本地臨時檔案存儲目錄

1）停止程序

按照resourcemanager/nodemanager->datanode/namenode的先後順停止程序

2）修改hadoop.tmp.dir

hadoop預設生成的dfs等檔案放在 /tmp/hadoop-{hostname} 下的當重新開機後系統臨時檔案夾中内容被清除，是以需要重新配置臨時檔案夾

在hadoop-2.7.2中建立 data/tmp 檔案夾

後修改 core-site.xml，增加屬性節點

3）格式化NameNode

4）啟動所有程序

按照 namenode/datanode->resourcemanager/nodemanager順序啟動

5）檢視/opt/module/hadoop-2.7.2/data/tmp這個目錄下的内容

啃掉Hadoop系列筆記(04)-Hadoop運作模式之僞分布式模式

一） HDFS上運作MapReduce 程式

二） YARN上運作MapReduce 程式

三）修改本地臨時檔案存儲目錄

繼續閱讀

大資料—Hadoop 3.x—二.hadoop搭建

大資料hadoop面試經典題

浙大研究所學生hadoop工作分享

2019年國内Hadoop大資料平台專業的計算引擎：MapReduce+Tez+Spark

啃掉Hadoop系列筆記(02)-Hadoop運作環境搭建

<Hadoop實戰>學習 -- 基礎知識，初級入門

Hadoop_sbin概述

初識Hadoop，入門基礎篇簡介核心特點HDFS的master/slave構架HDFS的關鍵元素MapReduce檔案系統

Hadoop學習：Windows環境下配置Java環境Windows下安裝JAVA環境

Hadoop分布式檔案系統HDFS的工作原理詳述

Java HotSpot(TM) Client VM warning: ignoring option MaxPermSize=128m; support was removed in 8.0

Zookeeper原理與實操前言：1 zookeeper概述2 zookeeper安裝3 zookeeper選舉機制4 zookeeper實操

docker CMD ENTRYPOINT差別

MapReduce輸入輸出格式常用輸入格式常用輸出格式

啃掉Hadoop系列筆記(04)-Hadoop運作模式之僞分布式模式

一） HDFS上運作MapReduce 程式

二） YARN上運作MapReduce 程式

三） 修改本地臨時檔案存儲目錄

繼續閱讀

三）修改本地臨時檔案存儲目錄