天天看點

HDFS常用檔案操作

<b><b><b><b></b></b></b></b>

<b><b><b><b><b></b></b></b></b></b>

<b><b><b><b><b><b></b></b></b></b></b></b>

<b><b><b><b><b><b><b>put</b></b></b></b></b></b></b>

上傳檔案    hadoop fs -put wordcount.txt   /data/wordcount/

<b>text</b>

檢視檔案内容   hadoop fs -text /output/wordcount/part-r-00000 

<b>ls</b>

hadoop fs -ls /   列出hdfs檔案系統根目錄下的目錄和檔案

hadoop fs -ls -r /   列出hdfs檔案系統所有目錄和檔案

<b>rm</b>

hadoop fs -rm &lt; hdfs file &gt; ...

hadoop fs -rm -r &lt; hdfs dir&gt;...

每次可以删除多個檔案或目錄

<b>mkdir</b>

<b>cp</b>

目标檔案不能存在,否則指令不能執行,相當于給檔案重命名并儲存,源檔案還存在

hadoop fs -cp &lt; hdfs file or dir &gt;... &lt; hdfs dir &gt;

目标檔案夾要存在,否則指令不能執行

<b>mv</b>

目标檔案不能存在,否則指令不能執行,相當于給檔案重命名并儲存,源檔案不存在

源路徑有多個時,目标路徑必須為目錄,且必須存在。

<b>count</b>

統計hdfs對應路徑下的目錄個數,檔案個數,檔案總計大小

顯示為目錄個數,檔案個數,檔案總計大小,輸入路徑

<b>du</b>

<b>stat</b>

傳回對應路徑的狀态資訊

<b>tail</b>

在标準輸出中顯示檔案末尾的1kb資料

<b>balancer</b>

如果管理者發現某些datanode儲存資料過多,某些datanode儲存資料相對較少,可以使用上述指令手動啟動内部的均衡過程

<b>hdfs dfsadmin -safemode &lt; enter | leave | get | wait &gt;</b>

wait:等待離開安全模式

<b>distcp</b>

用來在兩個hdfs之間拷貝資料

<b>setrep</b>

改變一個檔案在hdfs中的副本個數,上述指令中數字3為所設定的副本個數,-r選項可以對一個人目錄下的所有目錄+檔案遞歸執行改變副本個數的操作

繼續閱讀