Google資料中心一直是業界中令人着迷的“對象”之一。Google這個搜尋巨人很少暴露其資料中心,那麼Google到底有多少資料中心?它們分布在什麼地方?筆者整理收集一些有趣資訊,以供分享和參考。
Google資料中心分布圖
Google 搜尋速度為什麼能這麼快?這主要因為Google在全球分布着衆多的資料中心。根據現有資訊,如果包括在建的資料中心,Google共有36個資料中心。其中美國有19個、歐洲12個、俄羅斯1個、南美1個和亞洲3個(北京-Google.cn、香港-Google.com.hk和東京各1個)。不過,Google也并非完全獨享這些資料中心,他們也向其他公司出租空間。
圖1:Google資料中心-全球
圖2:Google資料中心-北美
圖3:Google資料中心-歐洲
Google的第一個“資料中心”
圖4:Google的第一個“資料中心”——BackRub
資料中心的伺服器
大部分公司都是向Dell、HP、IBM和SUN廠商直接購買伺服器。購買伺服器需要一大筆費用,如果 Google的伺服器均從其他公司購買,估計Google也無法有今天。時至今日,Google的所有伺服器均為自己一手打造。Google伺服器厚度 3.5寸,2U(兩機櫃式),它有2個CPU、2個硬碟,采用技嘉主機闆,有8個記憶體插槽。Google采用AMD與英特爾的x86處理器。在同樣大的空間 内,Google的伺服器比其他廠商的伺服器能容納更多的CPU.
圖5-1:Google伺服器
圖5-2:“世紀互聯”機房中谷歌的一組伺服器(DELL Precision 390 工作站)
資料中心以集裝箱為機關,每個集裝箱裡面有1160台伺服器,每個資料中心有衆多集裝箱。
資料中心的核心技術
Google一直都鐘情于開源軟體,也一直支援開源技術 (Google對手之一的Facebook也同樣重視開源技術)。Google伺服器使用的是Linux作業系統。Google的工程師按照平行計算的要 求對Linux進行了優化。Google開發自有核心軟體,開發語言是Java和C++。
Google的三大核心元素:
1、Google檔案系統(GFS);(GFS負責伺服器資料儲存工作)
2、Google大表;Bigtable:是Google一種對于半結構化資料進行 分布存儲與通路的接口或服務);由于Google的檔案系統異常龐大,以至于甲骨文和IBM公司的商業資料庫在方面無用武之地。另外,商業資料庫都是按 CPU數量來收費,如果Google使用商業資料庫,可想而知,這是一筆天文數字。是以,Google量體裁衣地設計了符合自身的大表。
3、Mapreduce 算法;它是Google開發的C++程式設計工具,用于大于1TB資料的大規模資料集并行運算。MapReduce能夠找出一個詞語在Google搜尋目錄中 出現的次數;一系列網頁中特定詞語出現的頻率;連結到某個特定網站的所有網站數量等。
雖然Google依靠許多開源項目實作了企業的騰飛,但Google始終對這三大核心元素保密。
資料中心的專利
1、伺服器内置電池。 每台伺服器都有一顆12伏特電,確定萬一主斷源斷電時還可持續供電。最終目的,節約成本。
2、可移動的資料中心集裝箱。2008年10月獲得該項專利,每個集裝箱中最多可容納1160台伺服器。
資料中心的開銷
根據Google的盈利報告,2006年Google在資料中心上的開銷是19億美元,2007年是24 億,2008年23.6億,2009年8億9百萬,2010年上半年已開銷7億1千5百萬。
圖7:Google資料中心“燒錢”曲線圖
資料中心的選址标準
1、大量的廉價電力;
2、綠色能源,更注重可再生能源;
3、靠近河流或湖泊;(裝置冷卻需要大量水源)
4、用地廣闊;(隐秘性和安全性)
5、和其他資料中心的距離;(資料中心之間的快速連結)
6、稅收優惠。
圖8:Google的伺服器(左)Google俄勒岡州Dalles資料中心(中)Google伺服器機櫃特寫(右)
Google的特殊資料中心——聖吉蘭資料中心
Google在比利時的聖吉蘭(Saint Ghislain)資料中心(圖3中編号26)根本沒有冷卻裝置,完全依靠純自然冷卻(即:用資料中心外面的新鮮空氣來支援冷卻系統)。一般來說,絕大部分資料中心都是采用水冷卻裝置。(這也就是為什麼資料中心選址時要考慮水源。)
圖9:Google比利時資料中心
圖10:比利時國王(左五)參觀Google比利時資料中心
Google的Dalles(達爾斯)資料中心
Dalles資料中心(圖2中編号8)位于俄勒岡州的波特蘭以東約80英裡,旁邊是哥倫比亞河,河上有座大壩——Dalles大壩,大壩為資料中心提供便宜的電力。資料中心有2座4層樓高的冷卻塔。(注:“Dalles”不是“Dallas”,Dallas達拉斯在德州。)
圖11:Dalles資料中心鳥瞰圖
以下這段話來自Nicholasg Carr,他曾經在2009年通路Dalles資料中。括号部分是筆者的注釋。
Dalles資料中心有3個超大機房(在圖11中有4個白色建築,但隻有3個是伺服器機房),每個機房有45個集裝箱,每個集裝箱可以放置1160台伺服器,故Dalles資料中心可以存放約15萬台伺服器。
Google的秘密
Google在其資料中心的位置和數量方面的保密工作做得很好。比如說:如果你反查Google各種爬蟲或者是Google各個域名的IP位址,所得結果幾乎看起來都是加州山景城的IP位址。是以,想通過反查IP位址,基本無法推斷出其資料中心的真正位置和真正數量。
此外,Google通常把其資料中心“僞裝”成有限責任公司, 表明上看起來和Google毫無瓜葛。比如:北卡羅來納州Lapis公司和愛荷華州的Tetra公司。
既然Google在其資料中心方面的保密工作做得很出色,是以本文的資訊未必是百分百正确。
其他相關舊聞
2008年1月28日有報道稱,Google将在TW建立一資料中心。TW經濟負責人陳瑞隆已确認此消息,并且表示已在TW西部彰化的彰濱工業區内為Google預算了一塊地。TW還将向 Google提供各種優待,包括土地稅折扣、保證電力供應穩定在内。不過至今一直沒有聽到這個資料中心在台的任何動靜。
在陳瑞隆确認消息 後的第二天,馬來西亞總理也宣布,Google有意在馬來西亞建立資料中心。
另據報道,Google有意在東歐的立陶宛建立資料中心。
另外,Google曾于2007年在南卡羅來納州的布利西伍德購買466英畝(1英畝約合4000平方米)土地,似乎是打算建立南卡的第二個資料中心。
本文轉自 taojin1240 51CTO部落格,原文連結:http://blog.51cto.com/taotao1240/713901,如需轉載請自行聯系原作者