diff 指令是 linux上非常重要的工具,用于比較檔案的内容,特别是比較兩個版本不同的檔案以找到改動的地方。diff在指令行中列印每一個行的改動。最新版本的diff還支援二進制檔案。diff程式的輸出被稱為更新檔 (patch),因為Linux系統中還有一個patch程式,可以根據diff的輸出将a.c的檔案内容更新為b.c。diff是svn、cvs、git等版本控制工具不可或缺的一部分。
1.指令格式:
diff[參數][變動前:檔案1或目錄1] [變動後:檔案2或目錄2]
2.指令功能:
diff指令能比較單個檔案或者目錄内容。
如果指定比較的是檔案,則隻有當輸入為文本檔案時才有效。以逐行的方式,比較文本檔案的異同處。
如果指定比較的是目錄的的時候,diff 指令會比較兩個目錄下名字相同的文本檔案。列出不同的二進制檔案、公共子目錄和隻在一個目錄出現的檔案。
3.指令參數:
- 指定要顯示多少行的文本。此參數必須與-c或-u參數一并使用。
-a或--text diff預設隻會逐行比較文本檔案。
-b或--ignore-space-change 不檢查空格字元的不同。
-B或--ignore-blank-lines 不檢查空白行。
-c 顯示全部内文,并标出不同之處。
-C或--context 與執行"-c-"指令相同。
-d或--minimal 使用不同的演算法,以較小的機關來做比較。
-D或ifdef 此參數的輸出格式可用于前置處理器巨集。
-e或--ed 此參數的輸出格式可用于ed的script檔案。
-f或-forward-ed 輸出的格式類似ed的script檔案,但按照原來檔案的順序來顯示不同處。
-H或--speed-large-files 比較大檔案時,可加快速度。
-l或--ignore-matching-lines 若兩個檔案在某幾行有所不同,而這幾行同時都包含了選項中指定的字元或字元串,則不顯示這兩個檔案的差異。
-i或--ignore-case 不檢查大小寫的不同。
-l或--paginate 将結果交由pr程式來分頁。
-n或--rcs 将比較結果以RCS的格式來顯示。
-N或--new-file 在比較目錄時,若檔案A僅出現在某個目錄中,預設會顯示:Only in目錄:檔案A若使用-N參數,則diff會将檔案A與一個空白的檔案比較。
-p 若比較的檔案為C語言的程式碼檔案時,顯示差異所在的函數名稱。
-P或--unidirectional-new-file 與-N類似,但隻有當第二個目錄包含了一個第一個目錄所沒有的檔案時,才會将這個檔案與空白的檔案做比較。
-q或--brief 僅顯示有無差異,不顯示詳細的資訊。
-r或--recursive 比較子目錄中的檔案。
-s或--report-identical-files 若沒有發現任何差異,仍然顯示資訊。
-S或--starting-file 在比較目錄時,從指定的檔案開始比較。
-t或--expand-tabs 在輸出時,将tab字元展開。
-T或--initial-tab 在每行前面加上tab字元以便對齊。
-u,-U或--unified= 以合并的方式來顯示檔案内容的不同。
-v或--version 顯示版本資訊。
-w或--ignore-all-space 忽略全部的空格字元。
-W或--width 在使用-y參數時,指定欄寬。
-x或--exclude 不比較選項中所指定的檔案或目錄。
-X或--exclude-from 您可以将檔案或目錄類型存成文本檔案,然後在=中指定此文本檔案。
-y或--side-by-side 以并列的方式顯示檔案的異同之處。
--help 顯示幫助。
--left-column 在使用-y參數時,若兩個檔案某一行内容相同,則僅在左側的欄位顯示該行内容。
--suppress-common-lines 在使用-y參數時,僅顯示不同之處。
4. 執行個體
4.1 diff的三種格式
由于曆史原因,diff有三種格式:
* 正常格式(normal diff)
* 上下文格式(context diff)
* 合并格式(unified diff)
我們依次來看。
4.2 示例檔案
為了便于講解,先建立兩個示例檔案。
第一個檔案叫做f1,内容是每行一個a,一共7行。
a
a
a
a
a
a
a
第二個檔案叫做f2,修改f1而成,第4行變成b,其他不變。
a
a
a
b
a
a
a
4.3 正常格式的diff
對f1和f2進行比較:
$ diff f1 f2
這時,diff就會顯示正常格式的結果:
4c4
< a
---
> b
第一行是一個提示,用來說明變動位置。
4c4
它分成三個部分:
前面的"4",表示f1的第4行有變化;
中間的"c"表示變動的模式是内容改變(change),其他模式還有"增加"(a,代表addition)和"删除"(d,代表deletion);
後面的"4",表示變動後變成f2的第4行。
第二行分成兩個部分。
< a
前面的小于号,表示要從f1當中去除該行(也就是第4行),後面的"a"表示該行的内容。
第三行用來分割f1和f2。
---
第四行,類似于第二行。
> b
前面的大于号表示f2增加了該行,後面的"b"表示該行的内容。
4.4 上下文格式的diff
上個世紀80年代初,加州大學伯克利分校推出BSD版本的Unix時,覺得diff的顯示結果太簡單,最好加入上下文,便于了解發生的變動。是以,推出了上下文格式的diff。
它的使用方法是加入c參數(代表context)。
$ diff -c f1 f2
顯示結果如下:
*** f1 2012-08-29 16:45:41.000000000 +0800
--- f2 2012-08-29 16:45:51.000000000 +0800
***************
*** 1,7 ****
a
a
a
!a
a
a
a
--- 1,7 ----
a
a
a
!b
a
a
a
這個結果分成四個部分。
第一部分的兩行,顯示兩個檔案的基本情況:檔案名和時間資訊。
*** f1 2012-08-29 16:45:41.000000000 +0800
--- f2 2012-08-29 16:45:51.000000000 +0800
"***"表示變動前的檔案,"---"表示變動後的檔案。
第二部分是15個星号,将檔案的基本情況與變動内容分割開。
***************
第三部分顯示變動前的檔案,即f1。
*** 1,7 ****
a
a
a
!a
a
a
a
這時不僅顯示發生變化的第4行,還顯示第4行的前面三行和後面三行,是以一共顯示7行。是以,前面的"*** 1,7 ****"就表示,從第1行開始連續7行。
另外,檔案内容的每一行最前面,還有一個标記位。如果為空,表示該行無變化;如果是感歎号(!),表示該行有改動;如果是減号(-),表示該行被删除;如果是加号(+),表示該行為新增。
第四部分顯示變動後的檔案,即f2。
--- 1,7 ----
a
a
a
!b
a
a
a
除了變動行(第4行)以外,也是上下文各顯示三行,總共顯示7行。
4.5 合并格式的diff
如果兩個檔案相似度很高,那麼上下文格式的diff,将顯示大量重複的内容,很浪費空間。1990年,GNU diff率先推出了"合并格式"的diff,将f1和f2的上下文合并在一起顯示。
它的使用方法是加入u參數(代表unified)。
$ diff -u f1 f2
顯示結果如下:
--- f1 2012-08-29 16:45:41.000000000 +0800
+++ f2 2012-08-29 16:45:51.000000000 +0800
@@ -1,7 +1,7 @@
a
a
a
-a
+b
a
a
a
它的第一部分,也是檔案的基本資訊。
--- f1 2012-08-29 16:45:41.000000000 +0800
+++ f2 2012-08-29 16:45:51.000000000 +0800
"---"表示變動前的檔案,"+++"表示變動後的檔案。
第二部分,變動的位置用兩個@作為起首和結束。
@@ -1,7 +1,7 @@
前面的"-1,7"分成三個部分:減号表示第一個檔案(即f1),"1"表示第1行,"7"表示連續7行。合在一起,就表示下面是第一個檔案從第1行開始的連續7行。同樣的,"+1,7"表示變動後,成為第二個檔案從第1行開始的連續7行。
第三部分是變動的具體内容。
a
a
a
-a
+b
a
a
a
除了有變動的那些行以外,也是上下文各顯示3行。它将兩個檔案的上下文,合并顯示在一起,是以叫做"合并格式"。每一行最前面的标志位,空表示無變動,減号表示第一個檔案删除的行,加号表示第二個檔案新增的行。
4.6 執行個體
執行個體1:比較兩個檔案
[email protected] test3]# diff log2014.log log2013.log
3c3
< 2014-03
---
> 2013-03
8c8
< 2013-07
---
> 2013-08
11,12d10
< 2013-11
< 2013-12
說明:上面的“3c3”和“8c8”表示log2014.log和log20143log檔案在第3行和第8行内容有所不同;"11,12d10"表示第一個檔案比第二個檔案多了第11和12行。
diff 的normal 顯示格式有三種提示:
a - add
c - change
d - delete
執行個體2:并排格式輸出
指令:diff log2013.log log2014.log -y -W 50
[[email protected] test3]# diff log2014.log log2013.log -y -W 50
2013-01 2013-01
2013-02 2013-02
2014-03 | 2013-03
2013-04 2013-04
2013-05 2013-05
2013-06 2013-06
2013-07 2013-07
2013-07 | 2013-08
2013-09 2013-09
2013-10 2013-10
2013-11 <
2013-12 <
[[email protected] test3]# diff log2013.log log2014.log -y -W 50
2013-01 2013-01
2013-02 2013-02
2013-03 | 2014-03
2013-04 2013-04
2013-05 2013-05
2013-06 2013-06
2013-07 2013-07
2013-08 | 2013-07
2013-09 2013-09
2013-10 2013-10
> 2013-11
> 2013-12
說明:
“|”表示前後2個檔案内容有不同
“<”表示後面檔案比前面檔案少了1行内容
“>”表示後面檔案比前面檔案多了1行内容
執行個體3:上下文輸出格式
指令:diff log2013.log log2014.log -c
[[email protected] test3]# diff log2013.log log2014.log -c
*** log2013.log 2012-12-07 16:36:26.000000000 +0800
--- log2014.log 2012-12-07 18:01:54.000000000 +0800
***************
*** 1,10 ****
2013-01
2013-02
! 2013-03
2013-04
2013-05
2013-06
2013-07
! 2013-08
2013-09
2013-10
--- 1,12 ----
2013-01
2013-02
! 2014-03
2013-04
2013-05
2013-06
2013-07
! 2013-07
2013-09
2013-10
+ 2013-11
+ 2013-12[[email protected] test3]# diff log2014.log log2013.log -c
*** log2014.log 2012-12-07 18:01:54.000000000 +0800
--- log2013.log 2012-12-07 16:36:26.000000000 +0800
***************
*** 1,12 ****
2013-01
2013-02
! 2014-03
2013-04
2013-05
2013-06
2013-07
! 2013-07
2013-09
2013-10
- 2013-11
- 2013-12
--- 1,10 ----
2013-01
2013-02
! 2013-03
2013-04
2013-05
2013-06
2013-07
! 2013-08
2013-09
2013-10[[email protected] test3]#
說明:
這種方式在開頭兩行作了比較檔案的說明,這裡有三中特殊字元:
“+” 比較的檔案的後者比前着多一行
“-” 比較的檔案的後者比前着少一行
“!” 比較的檔案兩者有差别的行
執行個體4:統一格式輸出
指令:diff log2014.log log2013.log -u
[[email protected] test3]# diff log2014.log log2013.log -u
--- log2014.log 2012-12-07 18:01:54.000000000 +0800
+++ log2013.log 2012-12-07 16:36:26.000000000 +0800
@@ -1,12 +1,10 @@
2013-01
2013-02
-2014-03
+2013-03
2013-04
2013-05
2013-06
2013-07
-2013-07
+2013-08
2013-09
2013-10
-2013-11
-2013-12
說明:
它的第一部分,也是檔案的基本資訊:
--- log2014.log 2012-12-07 18:01:54.000000000 +0800
+++ log2013.log 2012-12-07 16:36:26.000000000 +0800
"---"表示變動前的檔案,"+++"表示變動後的檔案。
第二部分,變動的位置用兩個@作為起首和結束。
@@ -1,12 +1,10 @@
前面的"-1,12"分成三個部分:減号表示第一個檔案(即log2014.log),"1"表示第1行,"12"表示連續12行。合在一起,就表示下面是第一個檔案從第1行開始的連續12行。同樣的,"+1,10"表示變動後,成為第二個檔案從第1行開始的連續10行。
執行個體5:比較檔案夾不同
指令:diff test3 test6
[[email protected] test]# diff test3 test6
Only in test6: linklog.log
Only in test6: log2012.log
diff test3/log2013.log test6/log2013.log
1,10c1,3
< 2013-01
< 2013-02
< 2013-03
< 2013-04
< 2013-05
< 2013-06
< 2013-07
< 2013-08
< 2013-09
< 2013-10
---
> hostnamebaidu=baidu.com
> hostnamesina=sina.com
> hostnames=true
diff test3/log2014.log test6/log2014.log
1,12d0
< 2013-01
< 2013-02
< 2014-03
< 2013-04
< 2013-05
< 2013-06
< 2013-07
< 2013-07
< 2013-09
< 2013-10
< 2013-11
< 2013-12
Only in test6: log2015.log
Only in test6: log2016.log
Only in test6: log2017.log
[[email protected] test]#
執行個體6:比較兩個檔案不同,并生産更新檔
指令:diff -ruN log2013.log log2014.log >patch.log
[[email protected] test3]# diff -ruN log2013.log log2014.log >patch.log
[[email protected] test3]# ll
總計 12
-rw-r--r-- 2 root root 80 12-07 16:36 log2013.log
-rw-r--r-- 1 root root 96 12-07 18:01 log2014.log
-rw-r--r-- 1 root root 248 12-07 21:33 patch.log
[[email protected] test3]# cat patc.log
cat: patc.log: 沒有那個檔案或目錄
[[email protected] test3]# cat patch.log
--- log2013.log 2012-12-07 16:36:26.000000000 +0800
+++ log2014.log 2012-12-07 18:01:54.000000000 +0800
@@ -1,10 +1,12 @@
2013-01
2013-02
-2013-03
+2014-03
2013-04
2013-05
2013-06
2013-07
-2013-08
+2013-07
2013-09
2013-10
+2013-11
+2013-12[[email protected] test3]#
執行個體7:打更新檔
指令: cat log2013.log
[[email protected] test3]# cat log2013.log
2013-01
2013-02
2013-03
2013-04
2013-05
2013-06
2013-07
2013-08
2013-09
2013-10[[email protected] test3]# patch log2013.log patch.log
patching file log2013.log
[r[email protected] test3]#
[[email protected] test3]# cat log2013.log
2013-01
2013-02
2014-03
2013-04
2013-05
2013-06
2013-07
2013-07
2013-09
2013-10
2013-11
2013-12[[email protected] test3]#
轉載于:https://www.cnblogs.com/xiaofeiIDO/p/6559303.html