天天看點

關于sort

linux下sort指令使用詳解---linux将文本檔案内容加以排序

功能說明:将文本檔案内容加以排序。

語  法:sort [-bcdfimMnr][-o<輸出檔案>][-t<分隔字元>][+<起始欄位>-<結束欄位>][--help][--verison][檔案]

補充說明:sort可針對文本檔案的内容,以行為機關來排序。

參  數:

  -b   忽略每行前面開始出的空格字元。

  -c   檢查檔案是否已經按照順序排序。

  -d   排序時,處理英文字母、數字及空格字元外,忽略其他的字元。

  -f   排序時,将小寫字母視為大寫字母。

  -i   排序時,除了040至176之間的ASCII字元外,忽略其他的字元。

  -m   将幾個排序好的檔案進行合并。

  -M   将前面3個字母依照月份的縮寫進行排序。

  -n   依照數值的大小排序。

  -o<輸出檔案>   将排序後的結果存入指定的檔案。

  -r   以相反的順序來排序。

  -t<分隔字元>   指定排序時所用的欄位分隔字元。

  +<起始欄位>-<結束欄位>   以指定的欄位來排序,範圍由起始欄位到結束欄位的前一欄位。

  --help   顯示幫助。

  --version   顯示版本資訊

下面通過幾個例子來講述Sort的使用。

使用者可以儲存排序後的檔案内容,或把排序後的檔案内容輸出至列印機。下例中使用者把排序後的檔案内容儲存到名為result的檔案中。

$ Sort text>result

以第2個字段作為排序關鍵字對檔案example的内容進行排序。

$ Sort +1-2 example

對于file1和file2檔案内容反向排序,結果放在outfile中,利用第2個字段的第一個字元作為排序關鍵字。

$ Sort -r -o outfile +1.0 -1.1 example

Sort排序常用于在管道中與其他指令連用,組合完成比較複雜的功能,如利用管道将目前工作目錄中的檔案送給Sort進行排序,排序關鍵字是第6個至第8個字段。

$ ls - l | Sort +5 - 7

$ ps -e -o " comm pid time"|Sort -d //按照command的首字母的字母順序排序

Sort指令也可以對标準輸入進行操作。例如,如果您想把幾個檔案文本行合并,并對合并後的文本行進行排序,您可以首先用指令cat把多個檔案合并,然後用管道操作把合并後的文本行輸入給指令Sort,Sort指令将輸出這些合并及排序後的文本行。在下面的例子中,檔案veglist與檔案 fruitlist的文本行經過合并與排序後被儲存到檔案clist中。

$ cat veglist fruitlist | Sort > clist

sort +3 -4 All-Unigene_PlantTFFamily_Abstract.out >All-Unigene_PlantTFFamily_Abstract.sort

sort -k 4  All-Unigene_PlantTFFamily_Abstract.out >All-Unigene_PlantTFFamily_Abstract.sort1

 對一個檔案兩列排序,一列正序一列逆序

sort -k1,1n -k2,2nr file

對一個檔案兩列排序

sort -k1,1n -k2,2n file

1 sort的工作原理

sort将檔案的每一行作為一個機關,互相比較,比較原則是從首字元向後,依次按ASCII碼值進行比較,最後将他們按升序輸出。

[rocrocket@rocrocket programming]$ cat seq.txt

banana

apple

pear

orange

[rocrocket@rocrocket programming]$ sort seq.txt

2 sort的-u選項

它的作用很簡單,就是在輸出行中去除重複行。

[rocrocket@rocrocket programming]$ sort -u seq.txt

pear由于重複被-u選項無情的删除了。

3 sort的-r選項

sort預設的排序方式是升序,如果想改成降序,就加個-r就搞定了。

[rocrocket@rocrocket programming]$ cat number.txt

1

3

5

2

4

[rocrocket@rocrocket programming]$ sort number.txt

[rocrocket@rocrocket programming]$ sort -r number.txt

4 sort的-o選項

由于sort預設是把結果輸出到标準輸出,是以需要用重定向才能将結果寫入檔案,形如sort filename > newfile。

但是,如果你想把排序結果輸出到原檔案中,用重定向可就不行了。

[rocrocket@rocrocket programming]$ sort -r number.txt > number.txt

[rocrocket@rocrocket programming]$

看,竟然将number清空了。

就在這個時候,-o選項出現了,它成功的解決了這個問題,讓你放心的将結果寫入原檔案。這或許也是-o比重定向的唯一優勢所在。

[rocrocket@rocrocket programming]$ sort -r number.txt -o number.txt

5 sort的-n選項

你有沒有遇到過10比2小的情況。我反正遇到過。出現這種情況是由于排序程式将這些數字按字元來排序了,排序程式會先比較1和2,顯然1小,是以就将10放在2前面喽。這也是sort的一貫作風。

我們如果想改變這種現狀,就要使用-n選項,來告訴sort,“要以數值來排序”!

10

19

11

[rocrocket@rocrocket programming]$ sort -n number.txt

6 sort的-t選項和-k選項

如果有一個檔案的内容是這樣:

[rocrocket@rocrocket programming]$ cat facebook.txt

banana:30:5.5

apple:10:2.5

pear:90:2.3

orange:20:3.4

這個檔案有三列,列與列之間用冒号隔開了,第一清單示水果類型,第二清單示水果數量,第三清單示水果價格。

那麼我想以水果數量來排序,也就是以第二列來排序,如何利用sort實作?

幸好,sort提供了-t選項,後面可以設定間隔

指定了間隔符之後,就可以用-k來指定列數了。

[rocrocket@rocrocket programming]$ sort -n -k 2 -t : facebook.txt

我們使用冒号作為間隔符,并針對第二列來進行數值升序排序,結果很令人滿意。

7 其他的sort常用選項

-f會将小寫字母都轉換為大寫字母來進行比較,亦即忽略大小寫

-c會檢查檔案是否已排好序,如果亂序,則輸出第一個亂序的行的相關資訊,最後傳回1

繼續閱讀