天天看點

幾個常用linux指令語句

幾個常用linux指令

通過 sort/uniq 擷取檔案内容的交集、合集和不同之處:假設有a、b兩個文本檔案,檔案本身已經去除了重複内容。下面是效率最高的方法,可以處理任何體積的檔案,甚至幾個G的檔案。(Sort 對記憶體沒有要求,但也許你需要用 -T 參數。)可以試着比較一下,你可以看看如果用 Java 來處理磁盤上檔案的合并,需要用多少行代碼。

cat a b sort uniq > c # c 是a和b的合集

cat a b sort uniq -d > c # c 是a和b的交集

cat a b b sort uniq -u > c # c 是a和b的不同

彙總一個文本内容裡第三列數字的和(這個方法要比用 Python 來做快 3 倍并隻需1/3 的代碼量):

wk ‘{ x += $3 } END { print x }’ myfile

如果你想檢視一個目錄樹裡的檔案的體積和修改日期,用下面的方法,相當于你挨個目錄做”ls -l”,而且輸出的形式比你用”ls -lR”更可讀:

find . -type f -ls

使用 xargs 指令。這個指令非常的強大。注意每行上你可以控制多少個東西的執行。如果你不确定它是正确的執行,先使用 xargs echo。同樣,-I{} 也非常有用。例子:

find . -name \*.py xargs grep some_function

cat hosts xargs -I{} ssh root@{} hostname

假設你有一個文本檔案,比如一個 web 伺服器日志,在某些行上有一些值,比如 URL 中的 acct_id 參數。如果你想統計每個 acct_id 的所有請求記錄:

cat access.log egrep -o ‘acct_id=[0-9]+’ cut -d= -f2 sort uniq -c sort -rn

原文

http://news.cnblogs.com/n/179752/