linux系統下的指令sort與uniq的參數選項詳解

2012-03-23 23:01:11

sort指令

sort指令的功能是對檔案中的各行進行排序。sort指令有許多非常實用的選項，這些選項最初是用來對資料庫格式的檔案内容進行各種排序操作的。實際上，sort指令可以被認為是一個非常強大的資料管理工具，用來管理内容類似資料庫記錄的檔案。

Sort指令将逐行對檔案中的内容進行排序，如果兩行的首字元相同，該指令将繼續比較這兩行的下一字元，如果還相同，将繼續進行比較。

文法：

sort [選項] 檔案

說明：sort指令對指定檔案中所有的行進行排序，并将結果顯示在标準輸出上。如不指定輸入檔案或使用“- ”，則表示排序内容來自标準輸入。

sort排序是根據從輸入行抽取的一個或多個關鍵字進行比較來完成的。排序關鍵字定義了用來排序的最小的字元序列。預設情況下以整行為關鍵字按ASCII字元順序進行排序。

改變預設設定的選項主要有：

- m 若給定檔案已排好序，合并檔案。

- c 檢查給定檔案是否已排好序，如果它們沒有都排好序，則列印一個出錯資訊，并以狀态值1退出。

- u 對排序後認為相同的行隻留其中一行。

- o 輸出檔案将排序輸出寫到輸出檔案中而不是标準輸出，如果輸出檔案是輸入檔案之一，sort先将該檔案的内容寫入一個臨時檔案，然後再排序和寫輸出結果。

改變預設排序規則的選項主要有：

- d 按字典順序排序，比較時僅字母、數字、空格和制表符有意義。

- f 将小寫字母與大寫字母同等對待。

- I 忽略非列印字元。

- M 作為月份比較：“JAN”<“FEB”

- r 按逆序輸出排序結果。

＋posl - pos2 指定一個或幾個字段作為排序關鍵字，字段位置從posl開始，到pos2為止（包括posl，不包括pos2）。如不指定pos2，則關鍵字為從posl到行尾。字段和字元的位置從0開始。

- b 在每行中尋找排序關鍵字時忽略前導的空白（空格和制表符）。

- t separator 指定字元separator作為字段分隔符。

uniq指令

檔案經過處理後在它的輸出檔案中可能會出現重複的行。例如，使用cat指令将兩個檔案合并後，再使用sort指令進行排序，就可能出現重複行。這時可以使用uniq指令将這些重複行從輸出檔案中删除，隻留下每條記錄的唯一樣本。

uniq [選項] 檔案

說明：這個指令讀取輸入檔案，并比較相鄰的行。在正常情況下，第二個及以後更多個重複行将被删去，行比較是根據所用字元集的排序序列進行的。該指令加工後的結果寫到輸出檔案中。輸入檔案和輸出檔案必須不同。如果輸入檔案用“- ”表示，則從标準輸入讀取。

該指令各選項含義如下：

- c 顯示輸出中，在每行行首加上本行在檔案中出現的次數。它可取代- u和- d選項。

- d 隻顯示重複行。

- u 隻顯示檔案中不重複的各行。

- n 前n個字段與每個字段前的空白一起被忽略。一個字段是一個非空格、非制表符的字元串，彼此由制表符和空格隔開（字段從0開始編号）。

n 前n個字元被忽略，之前的字元被跳過（字元從0開始編号）。

- f n 與- n相同，這裡n是字段數。

- s n 與＋n相同，這裡n是字元數。

linux系統下的指令sort與uniq的參數選項詳解

繼續閱讀

軟體開發的風險管理之二

java學習之心得體會

程式員基本素質要求

8個道理，讓你的程式人生受益終生

[轉]俞敏洪：在職場混好必讀的22本書

我遇到的一些國内開發者的毛病我遇到的一些國内開發者的毛病不會問問題缺失擷取資訊的能力缺乏知識體系盲目跟風缺乏責任感不獨立思考不切實際不閱讀太把技術當回事不思進取

我的職業生涯（四）

[好文摘錄] 怎麼樣向老闆提問看上去不蠢？工作中的兩種思維如何通過問問題明确任務職場中有80%的時間花在溝通上，剩下的20%才是你完成任務的時間。學會問問題，是職場溝通中最重要的技能之一。

一秒看透本質的人，是如何思考的？

程式員履歷上寫這種項目，難怪面試當炮灰。。。二、如何讓你的項目經驗更有技術含量

程式員不了解這些投履歷的巨坑，面試注定一開始就失敗！前言第一階段：練手第二階段：沖刺第三階段：收尾

在公司裡寫代碼天天摸魚偷懶，出去面試又該怎麼寫履歷？

砺鷹職業測評|更了解自己的職業興趣

面試的三重境界

世界500強常用的管理方法和工具

一個四年java程式員的年終總結