hadoop shell指令字典詳解

可以帶着下面問題來閱讀：

1.chmod與chown的差別是什麽？

2.cat将路徑指定檔案的内容輸出到哪裡？

3.cp能否是不同之間複制？

4.hdfs如何檢視檔案大小？

5.hdfs如何合并檔案？

6.如何顯示目前路徑下的所有檔案夾和檔案

7.rm删除檔案失敗的原因什麼？

8.如何檢視檔案的建立時間

9.檢視檔案指令的内容有哪些？能否說出三種？

10.如何判斷檔案是否存在？

11.如何建立0位元組檔案

對于指令，我們一次性記住，可能以後又忘記了，這裡大家用到的時候，可以檢視一下。

調用檔案系統(FS)Shell指令應使用 bin/hadoop fs <args>的形式。所有的的FS shell指令使用URI路徑作為參數。URI格式是scheme://authority/path。對HDFS檔案系統，scheme是hdfs，對本地檔案系統，scheme是file。其中scheme和authority參數都是可選的，如果未加指定，就會使用配置中指定的預設scheme。一個HDFS檔案或目錄比如/parent/child可以表示成hdfs://namenode:namenodeport/parent/child，或者更簡單的/parent/child（假設你配置檔案中的預設值是namenode:namenodeport）。大多數FS Shell指令的行為和對應的Unix Shell指令類似，不同之處會在下面介紹各指令使用詳情時指出。出錯資訊會輸出到stderr，其他資訊輸出到stdout。

（stderr與stdout這裡可以了解為檔案）

cat

使用方法：hadoop fs -cat URI [URI …]

将路徑指定檔案的内容輸出到stdout。

示例：

hadoop fs -cat hdfs://host1:port1/file1 hdfs://host2:port2/file2

hadoop fs -cat file:///file3 /user/hadoop/file4

傳回值：

成功傳回0，失敗傳回-1。

chgrp

chmod

使用方法：hadoop fs -chmod [-R] <MODE[,MODE]... | OCTALMODE> URI [URI …]

chown

使用方法：hadoop fs -chown [-R] [OWNER][:[GROUP]] URI [URI ]

copyFromLocal

使用方法：hadoop fs -copyFromLocal <localsrc> URI

除了限定源路徑是一個本地檔案外，和put指令相似。

copyToLocal

使用方法：hadoop fs -copyToLocal [-ignorecrc] [-crc] URI <localdst>

除了限定目标路徑是一個本地檔案外，和get指令類似。

使用方法：hadoop fs -cp URI [URI …] <dest>

将檔案從源路徑複制到目标路徑。這個指令允許有多個源路徑，此時目标路徑必須是一個目錄。

hadoop fs -cp /user/hadoop/file1 /user/hadoop/file2

hadoop fs -cp /user/hadoop/file1 /user/hadoop/file2 /user/hadoop/dir

使用方法：hadoop fs -du URI [URI …]

顯示目錄中所有檔案的大小，或者當隻指定一個檔案時，顯示此檔案的大小。

hadoop fs -du /user/hadoop/dir1 /user/hadoop/file1 hdfs://host:port/user/hadoop/dir1

成功傳回0，失敗傳回-1。

dus

使用方法：hadoop fs -dus <args>

顯示檔案的大小。

expunge

使用方法：hadoop fs -expunge

get

使用方法：hadoop fs -get [-ignorecrc] [-crc] <src> <localdst>

複制檔案到本地檔案系統。可用-ignorecrc選項複制CRC校驗失敗的檔案。使用-crc選項複制檔案以及CRC資訊。

hadoop fs -get /user/hadoop/file localfile

hadoop fs -get hdfs://host:port/user/hadoop/file localfile

getmerge

使用方法：hadoop fs -getmerge <src> <localdst> [addnl]

接受一個源目錄和一個目标檔案作為輸入，并且将源目錄中所有的檔案連接配接成本地目标檔案。addnl是可選的，用于指定在每個檔案結尾添加一個換行符。

使用方法：hadoop fs -ls <args>

如果是檔案，則按照如下格式傳回檔案資訊：

檔案名 <副本數> 檔案大小修改日期修改時間權限使用者ID 組ID

如果是目錄，則傳回它直接子檔案的一個清單，就像在Unix中一樣。目錄傳回清單的資訊如下：

目錄名 <dir> 修改日期修改時間權限使用者ID 組ID

hadoop fs -ls /user/hadoop/file1 /user/hadoop/file2 hdfs://host:port/user/hadoop/dir1 /nonexistentfile

lsr

使用方法：hadoop fs -lsr <args>

ls指令的遞歸版本。類似于Unix中的ls -R。

mkdir

使用方法：hadoop fs -mkdir <paths>

接受路徑指定的uri作為參數，建立這些目錄。其行為類似于Unix的mkdir -p，它會建立路徑中的各級父目錄。

hadoop fs -mkdir /user/hadoop/dir1 /user/hadoop/dir2

hadoop fs -mkdir hdfs://host1:port1/user/hadoop/dir hdfs://host2:port2/user/hadoop/dir

movefromLocal

使用方法：dfs -moveFromLocal <src> <dst>

輸出一個”not implemented“資訊。

使用方法：hadoop fs -mv URI [URI …] <dest>

将檔案從源路徑移動到目标路徑。這個指令允許有多個源路徑，此時目标路徑必須是一個目錄。不允許在不同的檔案系統間移動檔案。

hadoop fs -mv /user/hadoop/file1 /user/hadoop/file2

hadoop fs -mv hdfs://host:port/file1 hdfs://host:port/file2 hdfs://host:port/file3 hdfs://host:port/dir1

put

使用方法：hadoop fs -put <localsrc> ... <dst>

從本地檔案系統中複制單個或多個源路徑到目标檔案系統。也支援從标準輸入中讀取輸入寫入目标檔案系統。

hadoop fs -put localfile /user/hadoop/hadoopfile

hadoop fs -put localfile1 localfile2 /user/hadoop/hadoopdir

hadoop fs -put localfile hdfs://host:port/hadoop/hadoopfile

hadoop fs -put - hdfs://host:port/hadoop/hadoopfile

從标準輸入中讀取輸入。

使用方法：hadoop fs -rm URI [URI …]

删除指定的檔案。隻删除非空目錄和檔案。請參考rmr指令了解遞歸删除。

hadoop fs -rm hdfs://host:port/file /user/hadoop/emptydir

rmr

使用方法：hadoop fs -rmr URI [URI …]

delete的遞歸版本。

hadoop fs -rmr /user/hadoop/dir

hadoop fs -rmr hdfs://host:port/user/hadoop/dir

setrep

使用方法：hadoop fs -setrep [-R] <path>

改變一個檔案的副本系數。-R選項用于遞歸改變目錄下所有檔案的副本系數。

hadoop fs -setrep -w 3 -R /user/hadoop/dir1

stat

使用方法：hadoop fs -stat URI [URI …]

傳回指定路徑的統計資訊。

hadoop fs -stat path

tail

使用方法：hadoop fs -tail [-f] URI

将檔案尾部1K位元組的内容輸出到stdout。支援-f選項，行為和Unix中一緻。

hadoop fs -tail pathname

test

使用方法：hadoop fs -test -[ezd] URI

選項：

-e 檢查檔案是否存在。如果存在則傳回0。

-z 檢查檔案是否是0位元組。如果是則傳回0。

-d 如果路徑是個目錄，則傳回1，否則傳回0。

hadoop fs -test -e filename

text

使用方法：hadoop fs -text <src>

将源檔案輸出為文本格式。允許的格式是zip和TextRecordInputStream。

touchz

使用方法：hadoop fs -touchz URI [URI …]

建立一個0位元組的空檔案。

hadoop -touchz pathname

hadoop shell指令字典詳解

繼續閱讀

1.Linux指令行使用技巧

spec檔案詳解

hadoop 用MR實作join操作

Centos7 下 Hadoop 2.6.4 分布式叢集環境搭建摘要叢集準備安裝JDK 安裝 Hadoop 2.6.4 部署 slaver1-slaver4 啟動 hadoop 叢集成功了

HK-2000資料采集儀資料庫操作說明

終端環境之tmux

查找檔案中的字元串

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

拒絕使用者登入:/bin/false和/usr/sbin/nologin

Shell程式設計——sort排序、uniq忽略重複、tr替換壓縮删除、cut指定删除字段、正規表達式元字元sort 指令uniq 指令tr 指令cut 指令正規表達式

ubuntu14.04下安裝hbse1.0.1.1

Linxu常用指令技巧彙總

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

User Defined Hadoop DataType

ACS基本配置-權限等級管理

Ambari介紹和架構原理