在日常運維工作中,經常會用到版本控制系統,目前用到最廣泛的版本控制器就是SVN和Git,那麼這兩者之間有什麼不同之處呢?
SVN(Subversion)是集中式管理的版本控制器,而Git是分布式管理的版本控制器!這是兩者之間最核心的差別。
SVN隻有一個單一的集中管理的伺服器,儲存所有檔案的修訂版本,而協同工作的人們都通過用戶端連到這台伺服器,取出最新的檔案或者送出更新。
Git每一個終端都是一個倉庫,用戶端并不隻提取最新版本的檔案快照,而是把原始的代碼倉庫完整地鏡像下來。每一次的提取操作,實際上都是一次對代碼倉庫的完整備份。Git不僅僅是個版本控制系統,它也是個内容管理系統(CMS),工作管理系統等。如果你是一個具有使用SVN背景的人,你需要做一定的思想轉換,來适應Git提供的一些概念和特征。

---------------------------------------------------------------------------------------------------
集中式版本控制系統:
版本庫是集中存放在中央伺服器的,而幹活的時候,用的都是自己的電腦,是以要先從中央伺服器取得最新的版本,然後開始幹活,幹完活了,再把自己的活推送給中央伺服器。中央伺服器就好比是一個圖書館,你要改一本書,必須先從圖書館借出來,然後回到家自己改,改完了,再放回圖書館。
集中式版本控制系統最大的毛病就是必須聯網才能工作,如果在區域網路内還好,帶寬夠大,速度夠快,可如果在網際網路上,遇到網速慢的話,可能送出一個10M的檔案就需要5分鐘,這還不得把人給憋死啊。
分布式版本控制系統:
首先,分布式版本控制系統根本沒有“中央伺服器”,每個人的電腦上都是一個完整的版本庫,這樣,你工作的時候,就不需要聯網了,因為版本庫就在你自己的電腦上。既然每個人電腦上都有一個完整的版本庫,那多個人如何協作呢?比方說你在自己電腦上改了檔案A,你的同僚也在他的電腦上改了檔案A,這時,你們倆之間隻需把各自的修改推送給對方,就可以互相看到對方的修改了。
和集中式版本控制系統相比,分布式版本控制系統的安全性要高很多,因為每個人電腦裡都有完整的版本庫,某一個人的電腦壞掉了不要緊,随便從其他人那裡複制一個就可以了。而集中式版本控制系統的中央伺服器要是出了問題,所有人都沒法幹活了。
在實際使用分布式版本控制系統的時候,其實很少在兩人之間的電腦上推送版本庫的修改,因為可能你們倆不在一個區域網路内,兩台電腦互相通路不了,也可能今天你的同僚病了,他的電腦壓根沒有開機。是以,分布式版本控制系統通常也有一台充當“中央伺服器”的電腦,但這個伺服器的作用僅僅是用來友善“交換”大家的修改,沒有它大家也一樣幹活,隻是交換修改不友善而已。
當然,Git的優勢不單是不必聯網這麼簡單,後面我們還會看到Git極其強大的分支管理,把SVN等遠遠抛在了後面。
那麼Git和SVN兩者之間具體有哪些不同?下面詳細做下對比:
----------------------------------------------------------------------------------------------------------------
一、搞清楚兩種模式:集中式VS分布式
(1)SVN屬于集中式的版本控制系統
集中式的版本控制系統都有一個單一的集中管理的伺服器,儲存所有檔案的修訂版本,而協同工作的人們都通過用戶端連到這台伺服器,取出最新的檔案或者送出更新。
SVN的特點概括起來主要由以下幾條:
1)每個版本庫有唯一的URL(官方位址),每個使用者都從這個位址擷取代碼和資料;
2)擷取代碼的更新,也隻能連接配接到這個唯一的版本庫,同步以取得最新資料;
3)送出必須有網絡連接配接(非本地版本庫);
4)送出需要授權,如果沒有寫權限,送出會失敗;
5)送出并非每次都能夠成功。如果有其他人先于你送出,會提示“改動基于過時的版本,先更新再送出”… 諸如此類;
6)沖突解決是一個送出速度的競賽:手快者,先送出,平安無事;手慢者,後送出,可能遇到麻煩的沖突解決。
好處:每個人都可以一定程度上看到項目中的其他人正在做些什麼。而管理者也可以輕松掌控每個開發者的權限。
缺點:中央伺服器的單點故障。
若是當機一小時,那麼在這一小時内,誰都無法送出更新、還原、對比等,也就無法協同工作。如果中央伺服器的磁盤發生故障,并且沒做過備份或者備份得不夠及時的話,還會有丢失資料的風險。最壞的情況是徹底丢失整個項目的所有曆史更改記錄,被用戶端提取出來的某些快照資料除外,但這樣的話依然是個問題,你不能保證所有的資料都已經有人提取出來。
簡單來說,SVN原理上隻關心檔案内容的具體差異。每次記錄有哪些檔案作了更新,以及都更新了哪些行的什麼内容。
(2)Git屬于分布式的版本控制系統
Git記錄版本曆史隻關心檔案資料的整體是否發生變化。Git 不儲存檔案内容前後變化的差異資料。
實際上,Git 更像是把變化的檔案作快照後,記錄在一個微型的檔案系統中。每次送出更新時,它會縱覽一遍所有檔案的指紋資訊并對檔案作一快照,然後儲存一個指向這次快照的索引。為提高性能,若檔案沒有變化,Git 不會再次儲存,而隻對上次儲存的快照作一連接配接。
在分布式版本控制系統中,用戶端并不隻提取最新版本的檔案快照,而是把原始的代碼倉庫完整地鏡像下來。這麼一來,任何一處協同工作用的伺服器發生故障,事後都可以用任何一個鏡像出來的本地倉庫恢複。這類系統都可以指定和若幹不同的遠端代碼倉庫進行互動。籍此,你就可以在同一個項目中,分别和不同工作小組的人互相協作。你可以根據需要設定不同的協作流程。
另外,因為Git在本地磁盤上就儲存着所有有關目前項目的曆史更新,并且Git中的絕大多數操作都隻需要通路本地檔案和資源,不用連網,是以處理起來速度飛快。用SVN的話,沒有網絡或者斷開VPN你就無法做任何事情。但用Git的話,就算你在飛機或者火車上,都可以非常愉快地頻繁送出更新,等到了有網絡的時候再上傳到遠端的鏡像倉庫。換作其他版本控制系統,這麼做幾乎不可能,抑或是非常麻煩。
Git特點:
1)Git中每個克隆(clone)的版本庫都是平等的。你可以從任何一個版本庫的克隆來建立屬于你自己的版本庫,同時你的版本庫也可以作為源提供給他人,隻要你願意。
2)Git的每一次提取操作,實際上都是一次對代碼倉庫的完整備份。
3)送出完全在本地完成,無須别人給你授權,你的版本庫你作主,并且送出總是會成功。
4)甚至基于舊版本的改動也可以成功送出,送出會基于舊的版本建立一個新的分支。
5)Git的送出不會被打斷,直到你的工作完全滿意了,PUSH給他人或者他人PULL你的版本庫,合并會發生在PULL和PUSH過程中,不能自動解決的沖突會提示您手工完成。
6)沖突解決不再像是SVN一樣的送出競賽,而是在需要的時候才進行合并和沖突解決。
除此之外:
1)Git也可以模拟集中式的工作模式
Git版本庫統一放在伺服器中
可以為 Git 版本庫進行授權:誰能建立版本庫,誰能向版本庫PUSH,誰能夠讀取(克隆)版本庫
團隊的成員先将伺服器的版本庫克隆到本地;并經常的從伺服器的版本庫拉(PULL)最新的更新;
團隊的成員将自己的改動推(PUSH)到伺服器的版本庫中,當其他人和版本庫同步(PULL)時,會自動擷取改變
2)Git 的集中式工作模式非常靈活
你完全可以在脫離Git伺服器所在網絡的情況下,如移動辦公/出差時,照常使用代碼庫
你隻需要在能夠接入Git伺服器所在網絡時,PULL和PUSH即可完成和伺服器同步以及送出
Git提供rebase 指令,可以讓你的改動看起來是基于最新的代碼實作的改動
3)Git有更多的工作模式可以選擇,遠非 Subversion能比的。
二、用法上了解
(1)Git是分布式的,而SVN不是分布而是集中式的,需要說明的是Git并不是目前唯一的分布式版本控制系統,還有比如Mercurial等,是以說它們差不許多。不過話說回來Git跟Svn一樣有自己的集中式版本庫和Server端,但Git更傾向于分布式開發,因為每一個開發人員的電腦上都有一個LocalRepository以即使沒有網絡也一樣可以Commit,檢視曆史版本記錄,建立項目分支等操作,等網絡再次連接配接上Push到Server端。
從上面看GIt真的很棒,但是GIt adds Complexity,剛開始使用會有些疑惑,因為需要建兩個Repositories(Local Repositories & Remote Repositories),指令很多,除此之外你需要知道哪些指令在Local Repository,哪些指令在Remote Repository。
(2)Git把内容按中繼資料方式存儲,而SVN是按檔案:因為git目錄是處于你的機器上的一個克隆版的版本庫,它擁有中心版本庫上所有的東西,例如标簽,分支,版本記錄等。.git目錄的體積大小跟.svn比較,你會發現它們差距很大。
(3)Git沒有一個全局版本号,而SVN有:目前為止這是跟SVN相比Git缺少的最大的一個特征。
(4)Git的内容的完整性要優于SVN: GIT的内容存儲使用的是SHA-1雜湊演算法。這能確定代碼内容的完整性,確定在遇到磁盤故障和網絡問題時降低對版本庫的破壞。
(5)Git下載下傳下來後,在OffLine狀态下可以看到所有的Log,SVN不可以。
(6)剛開始用時很狗血的一點,SVN必須先Update才能Commit,忘記了合并時就會出現一些錯誤,git還是比較少的出現這種情況。
(7)克隆一份全新的目錄以同樣擁有五個分支來說,SVN是同時複製5個版本的檔案,也就是說重複五次同樣的動作。而Git隻是擷取檔案的每個版本的 元素,然後隻載入主要的分支(master)在我的經驗,克隆一個擁有将近一萬個送出(commit),五個分支,每個分支有大約1500個檔案的 SVN,耗了将近一個小時!而Git隻用了區區的1分鐘!
(8)版本庫(repository):SVN隻能有一個指定中央版本庫。當這個中央版本庫有問題時,所有工作成員都一起癱瘓直到版本庫維修完畢或者新的版本庫設立完成。而 Git可以有無限個版本庫。或者,更正确的說法,每一個Git都是一個版本庫,差別是它們是否擁有活躍目錄(Git Working Tree)。如果主要版本庫(例如:置於GitHub的版本庫)發生了什麼事,工作成員仍然可以在自己的本地版本庫(local repository)送出,等待主要版本庫恢複即可。工作成員也可以送出到其他的版本庫!
(9)分支(Branch)不同。
分支在SVN中一點不特别,分支在SVN就是版本庫中的另外一個完整目錄,且這個目錄擁有完整的實際檔案。如果你想知道是否合并了一個分支,你需要手工運作像這樣的指令svn propget svn:mergeinfo,來确認代碼是否被合并。是以,經常會發生有些分支被遺漏的情況。如果工作成員想要開啟新的分支,那将會影響“全世界”!每個人都會擁有和你一樣的分支。如果你的分支是用來進行破壞工作(安檢測試),那将會像傳染病一樣,你改一個分支,還得讓其他人重新切分支重新下載下傳,十分狗血。而 Git,每個工作成員可以任意在自己的本地版本庫開啟無限個分支。舉例:當我想嘗試破壞自己的程式(安檢測試),并且想保留這些被修改的檔案供日後使用, 我可以開一個分支,做我喜歡的事。完全不需擔心妨礙其他工作成員。隻要我不合并及送出到主要版本庫,沒有一個工作成員會被影響。等到我不需要這個分支時, 我隻要把它從我的本地版本庫删除即可。無痛無癢。
然而,處理GIT的分支卻是相當的簡單和有趣。你可以從同一個工作目錄下快速的在幾個分支間切換。你很容易發現未被合并的分支,你能簡單而快捷的合并這些檔案。Git的分支名是可以使用不同名字的。例如:我的本地分支名為OK,而在主要版本庫的名字其實是master。最值得一提,我可以在Git的任意一個送出點(commit point)開啟分支!(其中一個方法是使用gitk –all 可觀察整個送出記錄,然後在任意點開啟分支。)
(10)送出(Commit)上的不同:在SVN,當你送出你的完成品時,它将直接記錄到中央版本庫。當你發現你的完成品存在嚴重問題時,你已經無法阻止事情的發生了。如果網路中斷,你根本沒辦法送出!而Git的送出完全屬於本地版本庫的活動。而你隻需“推”(git push)到主要版本庫即可。Git的“推”其實是在執行“同步”(Sync)。
最後總結一下:
SVN的特點是簡單,隻是需要一個放代碼的地方時用是OK的。
Git的特點版本控制可以不依賴網絡做任何事情,對分支和合并有更好的支援(這應該算是開發者最關心的地方)。
*************** 當你發現自己的才華撐不起野心時,就請安靜下來學習吧!***************