天天看點

阿裡雲袁經凱:混合雲場景下的高性能存儲

2018存儲半導體大會上,阿裡雲進階技術專家袁經凱帶來了題為《混合雲場景下的的高性能存儲》的主題演講,介紹了阿裡雲在混合雲場景下高性能存儲的實踐。

其核心的内容是:如何将本地傳統的存儲系統與公共雲更好地融合在一起,使得使用者無需關心資料的實體位置,隻需要聚焦具體的業務實作。為此,不得不從技術手段克服很多問題,特别是本地和雲端的資料自由流動,以及面向應用的存儲性能一緻性等。在具體實踐中,阿裡雲實作了分布式的高性能存儲網關,但這個網關跟我們原來認識的網關又不一樣,究竟有什麼不一樣呢?我們還是來看看,他是怎麼說的吧。

以下是現場速記:

阿裡雲袁經凱:混合雲場景下的高性能存儲

大家好,我叫袁經凱,我來自阿裡雲,主要負責阿裡雲混合雲存儲架構方面的一些工作。這兩天我們聽到了許多關于高性能存儲媒體和Fabric優化的内容。今天我的主題是混合雲場景下的的高性能存儲,嘗試從另外一個角度看待不斷演進的高性能媒體,也即是在具體場景下,特别是在和雲結合的場景下,如何擁抱高性能存儲帶來的變化?以及相衍生的新的存儲産品形态等,這是我們目前考慮的問題。

我們首先回顧一下過去存儲媒體的發展,從早期的Hard Drive,到後來的SSD,以及最新的Persistent Memory(持久記憶體)。Hard Drive大概在十毫秒左右的時延,到SSD是亞毫秒的時延,到Persistent Memory(持久記憶體)直接到了納秒級的時延表現,可以看到整個存儲媒體是在快速的進化當中。而從另外一個角度講,我們對存儲媒體的性能行為定義也在發生着變化。不光是單純的IOPS或者Throughput,現在也更加關注性能的可靠性和穩定性方面。

而存儲媒體隻是存儲系統的一部分,存儲系統的不同的部署形态對整個存儲性能也有很大的影響或限制。早期單機的類似DAS直連的形态,性能受限于外部總線的發展;在資料中心的部署下,會看到SAN或者NAS的存儲形态,性能行為也受到Fabric的影響,如Ethernet、FC,InfiniBand和NVMe over fabric等;而在雲環境下,特别是在混合雲環境下,資料在公共雲和專有雲中之間自由流動,如何從使用者的角度實作統一的資料視圖以及統一的存儲性能表現,是一個比較大的挑戰。

我們看一下雲環境下工作負載的部署政策。從傳統的觀點來說,雲端提供計算和存儲的彈性,适合動态或較難預測的工作負載,同時提供更好的運維管理能力;而私有的資料中心更多是IO或計算密集的場景,或者是對時延要求比較高的形态,這也是傳統架構的特點。

而如今,公共雲在快速的演進當中,整個公共雲的存儲生态也在不斷的擴充,覆寫更豐富的業務負載。例如,性能上阿裡雲釋出了百萬IOPS和亞毫秒時延的ESSD;而存儲形态上,提供OSS對象存儲,容量型及性能型NAS,彈性的塊存儲服務等;而從上層的資料層面來看,提供緩存、消息隊列,以及RDS,NoSQL等多樣的資料服務。

但顯而易見的是,未來很長時間都會是公共雲、專有雲共存的形态。是以,如何實作公共雲和專有雲之間資料的自由流動,如何做到業務無感覺,使用者不需要關注資料的位置,實作資料的融合和自由遷移非常重要。

阿裡雲袁經凱:混合雲場景下的高性能存儲

理想狀态下,公共雲和專有雲之間的連接配接應該是如圖所示的狀态,使得公共雲的計算側能通路線下的資料,線下計算能通路線上的存儲,存儲和存儲之間能實作統一的管理,這是我們需要做到的。

阿裡雲袁經凱:混合雲場景下的高性能存儲

這是目前最常見的線下存儲和線上存儲之間的互聯狀态。将傳統的存儲陣列進行擴充,提供了與雲相內建的能力,進而充分利用雲端存儲在彈性和低成本,以及安全和高可靠性上的優勢,使得存儲陣列承載高性能場景之外更多的業務形态,這是非常直覺的需求。

阿裡雲袁經凱:混合雲場景下的高性能存儲

傳統存儲有分層和緩存的概念,以及容量層和性能層等這樣的分層結構。很自然,我們可以把目前雲端存儲,例如阿裡雲OSS存儲看作新的存儲層次。通過引入雲緩存、雲分層、雲備份等服務,可以按政策實作資料在本地的高性能存儲以及雲端的自由放置,進而實作存儲在成本,安全和高可用上的優化,這是一個直接的雲內建解決方案。

阿裡雲袁經凱:混合雲場景下的高性能存儲

另外,我們經常會遇到的“Cloud Burst”問題,需要雲上彈性的計算能力解決雲下動态的資料處理需求。這時候線上的計算和線下的存儲如何互聯,如何保持像線下計算通路線下存儲那樣的一緻的性能行為,是要解決的一個問題。

阿裡雲袁經凱:混合雲場景下的高性能存儲

目前的一個解決方案是“Colocation”的部署方式。線下的IDC實作企業托管的高性能存儲陣列和公共雲高速連接配接PoP點的直接互聯,進而保證雲上計算服務對線下存儲的低延遲時間通路,使得計算能平滑遷移到雲端。

當然,這種場景有一些限制,受限于公共雲高速連接配接以及IDC機房的地域分布限制,同時也無法支援跨域通路。而且還需要了解使用者的使用者場景對SLA的要求,然後根據鍊路時延進行評估和可行性分析。

阿裡雲袁經凱:混合雲場景下的高性能存儲

這是一個基于“Colocation“的典型的雲分析業務場景。使用者在邊緣側(Edge Storage)進行資料收集;邊緣側與Colocation服務下的高性能存儲通過資料複制服務進行資料互動;而高性能存儲和ECS計算執行個體之間,基于高速的資料通路,反複疊代計算生成訓練模型,然後将模型同步到邊緣側,在邊緣進行推斷。

上面的雲內建和“Colocation”兩個方案解決了線上存儲和線下存儲以及線下存儲和線上計算的內建,但是離我們理想情況還有一定的距離,也即如何把線上線下存儲作為資源池做統一的管理,進而對計算來說,如何做到存儲無差别,這也正是我們混合雲需要解決的問題。

阿裡雲袁經凱:混合雲場景下的高性能存儲

我們提出高性能的混合雲存儲網關的概念。

阿裡雲袁經凱:混合雲場景下的高性能存儲

新興技術成熟度曲線(編者注圖)

Gartner在新興技術成熟度曲線中認為雲存儲網關是一個淡化中的存儲形态,這裡其實是把存儲網關單純的當成傳統的協定橋接。而我們将網關看作一個演進的存儲形态:一方面,它會比其他存儲更靠近計算側,它會擁抱高性能存儲媒體帶來的變化,比如SSD或者Persistent Memory,進而作為一個高性能Cache形态;

而另一個方面,雲存儲網關承載傳統SDS(軟體定義存儲)的業務,作為存儲虛拟化的一部分,幫助我們把線上線下的異構存儲形态內建起來,讓使用者的存儲成為一個整體。

阿裡雲袁經凱:混合雲場景下的高性能存儲

我們實作了這樣的雲存儲網關,它可以看做是雲存儲生态的一部分。對外的前端支援不同的存儲協定,包括iSCSI,對象或者NAS,後端對接我們的傳統資料中心和公共雲。通過實作了一個虛拟化的存儲層次,既可以對接線上的不同的存儲生态,像我們的雲端OSS和NAS,也可以對接線下的存儲生态,最終形成統一的Storage Pool(存儲池)的概念。我們也支援靈活的部署方式,既有Virtual Appliance(虛拟化裝置),也有Bare metal(裸金屬)的部署。

整體上它實作了一個全局的緩存服務,這種緩存服務與我們現有的分布式緩存在實作上有不一樣的地方。舉個例子,針對不同客戶的場景我們會有不同的一緻性實作,比如在多點協同的場景,很多隻需要最終一緻性的語義。是以雲存儲網關會考慮混合雲場景下性能和一緻性間的多種權衡和實作政策,以适應的不同業務需求。

阿裡雲袁經凱:混合雲場景下的高性能存儲

是以,從宏觀的角度看雲存儲網關的形态,它可以支援線上線下部署,靠近線上線下計算側。使用者看到的是Global Name Space(全局命名空間),它将線上線下存儲結合起來形成統一的資料視圖,進而接入傳統的企業存儲和線上的存儲生态,形成完整的生命周期管理。并以此解決混合雲場景下的各種問題,比如資料及應用的平滑遷移,基于政策的成本管理控制等。

阿裡雲袁經凱:混合雲場景下的高性能存儲

最後,我們看一下整個阿裡雲混合雲存儲全景實作。

首先,我們支援雲上雲下快速的離線和線上的資料遷移。實際應用中,我們幫助115網盤完成百PB級的資料遷移;我們支援資料和應用在雲上雲下的備份和容災,提供容災一體機以及BaaS(Backup as a Service)和DRaaS(Disaster Recovery as a Service)服務;我們提供硬體和軟體形态的雲存儲網關和雲存儲陣列,作為企業存儲生态的一個重要組成部分;同時,我們和第三方的存儲陣列廠商進行合作,提供靈活的內建政策,像SDK或VM,Container的等方式的內建,幫助傳統廠商快速實作雲內建能力。

以上是整個阿裡雲混合雲存儲的簡單介紹。混合雲存儲生态以及雲存儲網關在不斷演進當中,我們後續會繼續關注如何針對現有的SSD和持久記憶體做進一步的優化,這是我演講的主要内容,謝謝大家!

繼續閱讀