天天看點

OpenStack并非科學項目,但仍須“對各元件進行整合”

gartner公司曾經将openstack定義為一個“科學項目”。然而在與國家計算基礎設施協會的andrew howard進行溝通時,他結合澳洲規模最大的openstack部署方案給出了不同觀點。

在這座占地面積900平方米的資料中心内承載着30pb資料,且利用aarnet作為組成部分接入nectar。howard在采訪中表示,nci以openstack為基礎的軟體定義網絡改變了研究人員們的固有思維方式。

十年之前,他指出,大多數研究人員都選擇使用一台高端pc并希望其中提供充裕的磁盤空間來運作各類應用。如果将其中一部分參數集交由it部門來打理,那麼恐怕沒有任何一套技術支援體系能夠順利接管。

然而時至今日,howard表示,“大家可以運作自己的計算任務并将資料存儲在國家級設施當中。如今可供支配的計算資源較本地環境更為豐富,我們也能夠把處理結果通過網絡傳回設施内部。”

“它改變了資源的消費方式,也讓研究人員擁有了超越部門甚至是高校級别的資源支配能力。由于項目本身是由聯邦政府贊助的,是以幾乎任何其它組織都無法在規模上與之比肩。”

作為澳洲早期網際網路規劃的參與者之一,howard亦投身于openflow早期開發并在nci考慮使用openstack之後拿出三年半時間進行研究,是以他對于openstack如今的表現有着相當深入的了解。

相較于基于tcp/ip的路由機制——大家可以将其了解成世界上最原始的“sdn”——sdn的核心實質在于“對資料流進行進一步細分處理”,howard解釋道。

這對于nci當然是一件大事,因為其科學高性能計算體系專門面向規模龐大但周期相對較短的資料流、大量使用者以及遍布全國的基礎設施。

大科學,大網絡

在舊有模式當中,“遠端”機制是指使用者能夠以登入方式通過網絡通路與自身所在位置相距甚遠的集中資源。現在,需要對cern資料(或者天文資料)進行處理的研究人員希望能夠從來源處擷取資料,将其移動至應用當中,運作該款應用,擷取結果并共享結果等等。

“為了實作網絡裝置商用化,供應商需要提供低成本交換機,同時将其全部內建至單一sdn控制台當中,進而實際成本節約,”他表示,但在nci看來,sdn的重要性已經遠遠高于上述作法帶來的複雜難題。

“對于我們來說,真正的成本優勢在于能夠跨越多套國家級設施實作靈活性目标。”

sdn控制台的存在,意味着nci的使用者們不再需要以某種方式借助電信營運商的力量,他表示:“我們可以為研究人員建立複雜的内部網絡,其負責以透明方式跨aarnet實作資料傳輸,而無需觸及營運商控制台。”

aarnet對sdn功能的支援能力非常重要,因為研究人員所使用的網絡容量将直接轉化為應用程式功能——這種關系與上世紀九十年代的方案非常相似:“十五年之前,那時候人們還在使用isdn pri或者atm(即初級速率接口與異步傳輸模式)。大家可以撥号上網并直接使用資源。”

“事實證明,這确定是一種極具成本效益的軟體實作方式。”

如今的體系建構工作再次回歸十年前的思路,“大部分資源由雲環境提供”,而openstack則在nci用于承載工作負載的虛拟機體系的更新工作當中起到舉足輕重的作用。

軟體堆棧“仍需要時間以達到成熟”,howard告訴我們,但openstack未來三年的定期更新規劃已經讓nci方面有信心将其引入生産環境,而rackspace等廠商也在配合推出相關方案——這一切都讓openstack已經不再僅僅屬于實驗室環境下的“科學項目”。

盡管如此,howard指出:“這是一整套複雜的軟體集合,需要想辦法将其整合起來。”雖然大家“無法在車庫中實作內建并立即将其投入生産環境”,但先以小規模方式安裝并摸索無疑是了解openstack的最佳途徑,他建議稱。

而對于使用者來說,由技能積累帶來的收益也顯而易見。“無論具體使用哪種虛拟化平台,這些技能都可以稍加調整即運用于vmware等各類平台之上。”

相較于那些令人頭痛的高難度環境,howard強調稱,nci發現openstack一直在“緻力于平衡可用功能、簡化功能優勢的具體實作方式以及有效教育訓練研究人員運用環境優勢”。

為了盡可能降低研究人員的上手難度,大量名額被納入儀表闆以供他們随時檢視。

“最典型的執行個體就是虛拟基礎設施即服務平台——這是一套标準的openstack平台,使用者可以借此啟動虛拟機并在此基礎上建構應用程式。”

此外還有更多進階用例,例如跨越多套設施或機建構立虛拟實驗體系。在各虛拟實驗室中,openstack能夠實作多種彈性工作負載,例如在支援nci高性能計算服務的同時運作後處理虛拟化機制。

“研究人員能夠登入至門戶站點,将資料拖拽至/出其設施,點選對話框并運作工作負載。我們則負責完成配置工作——我認為這絕對是種與衆不同的實作方式。”

“我們能夠支援大規模資料流:作為國家級科學樞紐,我們負責處理來自ska、cern、copernicus以及地球傳感系統的資料——其資料總量無疑極為龐大。”

“是以,我們能否取得成功完全依靠網絡體系的表現。對于使用者來說,我們需要為其提供真正穩定且值得信賴的高性能資源。”

本文轉自d1net(轉載)

繼續閱讀