天天看點

Facebook交換機邁向100G 以适用下一代資料中心

facebook宣布正在打造架頂100gbit/s的以太網交換機,以用于其下一代資料中心上。很多大網際網路公司都在設計自己的系統,務必緊随先進的計算和半導體技術的步伐。

facebook的wedge 100是一個32×100g交換機,據傳用的是broadcom最新tomahawk交換晶片,最大總吞吐量達3.2 tbit/s。和以往一樣,facebook會開源自己的硬體設計,以供他人制造和使用。預計wedge 100将運作一個名為fboss的開源linux軟體,facebook目前在40g交換機上用的就是fboss。

今年8月,facebook光學專家描述過一個利用100g單模光纖數據機将100g成本降到1美元/gbyte的設計。該設計将距離要求從2公裡放寬到了500米,同時也放寬了工作溫度和産品壽命規格。它是基于qsfp28可插拔外形,用了4個25gbit/s的線路。

facebook沒有提供wedge 100部署時間的細節,也沒有給出如何處理來自100g tor交換機彙總資料的細節。

不到18個月前​​,網絡巨頭facebook曾公布過旗下正在設計40gbit/s的tor以太網交換機,此為wedge第一代。此項工作是在2013年底與交換晶片制造商會面後開始的。

facebook将上述設計重新定向為所謂的“6-pack”的彙聚交換機。該系統是facebook一年前宣布新資料中心架構的重要組成部分。

今年三月,facebook展示了自己的基于broadcom trident ii 晶片的16×40g wedge,然後又将其設計成線路卡和一個雙插槽卡,用于建立128×40ge 6-pack彙聚交換機,基于可以更新到100g接口版的10g的通道,通道可更新到25g。

當時,facebook的工程師表示正在弄32×100ge交換機,并有計劃用到100g和400g光鍊路。

一名facebook工程師在電子郵件表示,“我們現在在生産線上使用成千上萬的wedge 40 tor交換機,我們預計将繼續在相當長一段時間内使用它。”

他表示,“我們仍處于使用wedge100初期階段,等一切就緒後就可以用到我們的下一代資料中心上。我們的最終目标是在我們所有的資料中心的架頂上使用wedge。”

與來自arista 和 dell的同款100g晶片比,facebook設計針對自己的資料中心系統做的優化想必更嚴謹些,價格想必更便宜些。和其他網絡巨頭一樣,facebook設計自己的龐大計算機網絡系統,其規模之大可以想象。

大型資料中心的容量已 接近計算機網絡技術的極限。各種基于50g結構的400g交換機仍在實驗室裡,800g以太網标準也是最近才定稿。

the linley group進階分析師bob wheeler表示,“那種用16x25gbit/s技術的400g以太網提供的價值不大,而50gbit/s技術是關鍵”,對下一代系統來說是這樣。他表示,“有些供應商目前正在制56gbit/s pam4phy樣品。光子產品可望在2017年投産。”

facebook在一篇部落格文章公布了wedge 100的進展。博文還提供了目前40g交換機的可用性程度的一些細節以及其在使用時遇到的挑戰。

博文指,“常常見到的交換機失效模式是,cpu出現過載後滞後于控制平面的職責,比如發送路由協定封包或對asic程式設計這一類的職責,這時通信就會出現中斷。”

博文稱,“在我們的早期測試過程中,我們遇到一些情況,凸顯出保護cpu和控制平面是非常重要的。我們現在的配置對從交換機asic發往cpu的流量設了硬性限制。此外,我們将控制平面流量的優先級别設得比交換機高,以盡量保證元件的控制平面處于運作狀态。“

作者:何妍 

來源:51cto

繼續閱讀