Hadoop自帶WordCount進行詞頻統計（mapreduce）step1

2023-05-20 11:43:59

Hadoop自帶WordCount進行詞頻統計

準備：

安裝好的Hadoop
需要統計詞頻txt檔案（用jieba分過詞的

連結: pycharm 分詞 jieba 結巴分詞輸出txt.

step1

啟動Hadoop

cd /usr/local/hadoop

./sbin/start-all.sh

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1

用jps指令檢視是否開啟成功

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1

準備好需要統計詞頻的txt檔案（也可以用filezilla傳入Ubuntu）

連結: 如何用filezilla連接配接Ubuntu.

找到Hadoop檔案所在位置

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1

把需要計算詞頻的檔案放在Hadoop檔案下（記得這個檔案要用jieba分好詞後的檔案）

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1

step2

使用Hadoop自帶的jar包用wordcount計算詞頻

建立一個檔案夾存放需要計算詞頻的txt檔案

bin/hdfs dfs -mkdir -p  /input

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1

把需要計算詞頻的檔案放到剛剛所建的檔案夾中（txt檔案一定要放在Hadoop檔案夾下嗷）

bin/hdfs dfs -put hlm.txt  /input

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1

檢視 /input檔案夾下面的檔案

bin/hdfs dfs -ls  /input

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1

使用jar包中的wordcount計算詞頻

jar包的位置：

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1
share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1
計算詞頻代碼

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount  /input/hlm.txt  /out/hlmcount

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /input/hlm.txt /out/hlmcount

注意每個人的Hadoop版本不同黃線上的檔案名也不同

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1
敲下回車之後

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1

檢視輸出的結果

bin/hdfs dfs -cat /out/hlmcount/part-r-00000

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1

完美結束~

Hadoop自帶WordCount進行詞頻統計（mapreduce）step1

step1

step2

繼續閱讀

MapReduce運作Wordcount時一直卡在INFO mapreduce.Job: Running job，web檢視一直處于accepted階段

ubuntu hadoop2.6.1，terminal下運作wordcount

MapReduce(一)：入門級程式wordcount及其分析

HiveQl語句應用執行個體：WordCount具體步驟如下：

hadoop操作遇到的問題問題一：輸出檔案已存在

用mapreduce計算wordCount和手機流量統計程式運作過程WordCount統計手機流量統計

Hadoop之運作wordcount

jdk1.7+Eclipse+Maven3.5+Hadoop2.7.3建構hadoop項目

Eclipse運作WordCount（詳細版）相關連接配接Eclipse運作WordCount

專家訪談：搜尋開源力量：Lucene技術前景

hadoop 用MR實作join操作

Centos7 下 Hadoop 2.6.4 分布式叢集環境搭建摘要叢集準備安裝JDK 安裝 Hadoop 2.6.4 部署 slaver1-slaver4 啟動 hadoop 叢集成功了

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

ubuntu14.04下安裝hbse1.0.1.1

User Defined Hadoop DataType

Ambari介紹和架構原理