天天看點

阿裡雲李飛飛:什麼是雲原生資料庫

阿裡雲李飛飛:什麼是雲原生資料庫

作者 | 飛刀

來源 | 阿裡技術公衆号

雲原生是一種新型技術體系,是雲計算未來的發展方向。今天,我來談談何為雲原生、雲原生如何與分布式有機結合,以及雲原生技術如何幫助客戶邁入數字原生時代。

阿裡雲李飛飛:什麼是雲原生資料庫
李飛飛,阿裡巴巴集團副總裁,ACM傑出科學家,阿裡雲資料庫産品事業部負責人,達摩院資料庫與存儲實驗室負責人。

一 雲原生:從小池塘到江河大海

雲原生資料庫在海外被稱為「Cloud-Native Database Systems」,前面譯成中文就是「雲原生」,了解雲原生先要了解兩個關鍵詞——「雲」和「原生」。

在傳統資料庫的系統架構下,必須是緊耦合的設計方式,才能最大效能地發揮系統的優勢。舉個生活中的例子,過去每家每戶會根據用水量打一口水井使用,這與傳統的資料庫系統使用計算、存儲資源的方式一樣,但它是緊耦合的方式。如果水不夠了怎麼辦?對應的,這就是傳統資料庫系統裡經常提到的業務擴容。在金融行業,資料庫系統擴容通常需要提前幾個月甚至半年去做規劃,進而細緻部署、缜密實施,上線——灰階——再驗證,一整套流程就是為了擴容、縮容。傳統擴容過程非常漫長,而業務高峰過後縮容也很痛苦,往往會造成極大的資源浪費,也很難應對業務層需要的快速變化能力,這是傳統架構非常大的弊端之一。

如果清楚這些概念和背景就很好了解雲原生了。「雲」就是使用虛拟化的技術将資源池化。水是資源,不用緊耦合的方式來部署和使用,不用家家戶戶打水井,而是整個村莊聯合起來“打”一個湖或池塘,再修管道連到各家各戶,這就是資源池化。資源池化以後可以做到按需按量使用,彈性排程,甚至還可以将資源進行解耦,比如,将廚房當作一個計算節點,水當作存儲節點,可以随時切換,如果這個廚房不夠了,通過系統排程,可以快速拉起另外兩三個廚房做計算。這就是雲原生核心邏輯,将不同類型資源解耦,并進行池化。讓原來的一口口獨立水井,在背後合并成一個看不見的江河湖海。具體的,比如在雲原生的計算存儲分離架構下,業務節點可以根據需要自由的對計算、存儲進行快速的擴縮容等操作。

可以看到,雲原生帶來的本質性變化就像水井和池塘,随着池塘不斷變大,越來越多應用遷移上雲,池塘不再是池塘,而變成了江河大海。雲原生帶來的最大技術紅利以及經濟紅利就是規模化應用後帶來邊際成本下降效應,是以向雲原生技術演進的趨勢自然發生并且非常清晰,無論用公共雲還是專有雲私有化部署。這個邊際成本下降效應展現在産品上,客戶就會是以受益,TCO也一定會下降。

二 資料庫的未來:雲原生+分布式

全球知名咨詢公司Gartner指出,雲将主導資料庫市場的未來,到2022年,75%的資料庫将被部署或遷移至雲平台,隻有25%的資料庫會在本地運作。雲化無疑代表了未來,企業如何在雲原生架構下使用資料庫,就成為必須要思考的問題的。

随着企業業務全面向數字化、線上化、智能化演進,企業面臨着呈指數級遞增的海量存儲需求和挑戰,業務有更多的熱點和突發流量帶來的挑戰,企業需要降本增效,進行更智能的資料決策,傳統的商業資料庫已經難以滿足和響應快速增長的業務訴求。

在架構創新上,我們将雲原生與分布式結合起來,全新的雲原生分布式架構的資料庫具備了高擴充性、易用性、疊代快速、成本降低等特點,可以很好的幫助企業解決上述問題。未來資料庫也将全面進入雲原生加分布式的時代。具體來講:

1 高擴充性

雲原生分布式資料庫與底層的雲計算基礎設施分離,是以能夠靈活及時調動資源進行擴容縮容,以從容應對流量激增帶來的壓力,以及流量低谷期因資源過剩造成的浪費。生态相容的特點,也讓雲原生資料庫具備很強的可遷移性。

2 易用性

雲原生分布式資料庫非常易于使用,它的計算節點在雲端部署,可以随時随地從多前端通路。因其叢集部署在雲上,通過自動化的容災與高可用能力,單點失敗對服務的影響非常小。當需要更新或更換服務時,還可以對節點進行不中斷服務的輪轉更新。

3 快速疊代

雲原生分布式資料庫中的各項服務之間互相獨立,個别服務的更新不會對其他部分産生影響。此外,雲原生的研發測試和運維工具高度自動化,也就可以實作更加靈活的更新與疊代。

4 節約成本

建立資料中心是一項獨立而完備的工程,需要大量的硬體投資以及管理和維護資料中心的專業運維人員。此外,持續運維會造成很大的财務壓力。雲原生分布式資料庫以較低的前期成本,獲得一個可擴充的資料庫,實作更優化的資源配置設定。

三 “大資料與資料庫系統的一體化”新時代

目前,資料庫領域有幾大核心發展趨勢,除了上述提及的雲原生和分布式技術的融合,還有大資料與資料庫一體化,包括HTAP以及離線上一體化;智能化技術深度融合,即自感覺+自決策+自恢複+自優化;Multi-Model多模;軟硬體一體化,充分發揮新硬體的優勢;安全可信技術,即可驗證日志、資料隐私保護與安全多方計算+全鍊路加密。

在資料分析領域,企業亟需高效解決海量資料深度計算分析,下一代資料分析演進方向應該是“以雲原生為基礎,離線上一體化技術融合,實作資料庫大資料一體化”。“資料庫大資料一體化”的雲原生資料分析系統能夠很好的提供彈性擴充、海量存儲、多種計算及低成本等能力,有效解決海量資料深度計算分析的業務分析和創新訴求。

“資料庫大資料一體化”也是業界近年的發展趨勢。Gartner “There is only one DBMS Market”報告指出,過去根據業務場景按照分析型和交易型需求,需要獨立發展OPDBMS(事務處理)和DMSA(管理與分析),而未來分析型和交易型資料操作對技術架構依賴性會更小,将不再需要獨立區分OPDBMS和DMSA,通過一體化的資料處理技術即可滿足大多訴求。

從技術架構演進過程來看,2003至2006年,Google釋出了關于Google File System、MapReduce和BigTable三篇海量資料存儲、處理技術論文,奠定了今天大資料的整個技術生态圈的基石。2012年至今,随着雲計算的發展,雲計算的資源池化、存儲與計算彈性擴充等基礎設施更新,以及計算存儲分離、在離線一體化等技術創新,促進了資料處理開始朝一份資料開放計算、存儲計算分離的雲原生方向演進,誕生了如Snowflake、AWS Redshift、AWS Aurora、AWS Athena為代表的新一代雲原生資料庫、資料倉庫、資料湖,加速了資料處理向線上化、在離線一體化、結構化與非結構融合處理演進,加速業務走向數字化、數智化創新的新形态。

綜上所述,我認為“資料庫大資料一體化”的資料分析系統應具備幾個特點:雲原生;一份存儲多種計算;海量存儲,支援結構化、半結構化及非結構化資料庫的存儲及計算;全面相容資料庫生态。

四 雲原生時代,中國資料庫的曆史新機遇

在剛剛過去的2020年,Gartner公布了年度全球資料庫魔力象限評估結果,Gartner将OPDBMS(事務性關系型資料庫)與DMSA(大資料管理與分析)合二為一成為新的Cloud DBMS Market(統一的雲資料庫系統市場),故這次的評比更加全面,也代表了“雲”的發展趨勢。阿裡雲挺進全球資料庫第一陣營——上司者象限,這是中國資料庫曆史上重大突破,也是中國在基礎軟體行業首次成為Gartner魔力象限的全球上司者,代表着中國技術正日益走向國際舞台,并日漸成為這個舞台中的佼佼者。正如Gartner分析師所說:“阿裡雲擁有豐富的資料庫種類和完善的産品布局,為使用者提供多種關系型、分析型和非關系型資料庫産品,還提供混合雲環境部署,同時內建備份、資料遷移與同步等能力,最重要的是,阿裡雲有非常強大的技術實力與創新能力。”

在OLTP領域,阿裡雲提供核心的雲托管資料庫服務RDS,以及雲原生關系型資料庫 PolarDB以及分布式版PolarDB-X。阿裡雲RDS具備智能化、安全可信、簡易運維、高可用、高成本效益等多種特性。PolarDB是國内首個雲原生關系型資料庫,也是國内首個基于存儲與計算分離架構雲原生資料庫,已全面應用于零售、電信、物流、金融等多個行業;PolarDB-X基于雲原生分布式一體化架構設計,可支撐千萬級并發規模及百PB級海量存儲,在阿裡巴巴線上核心系統廣泛使用,連續多年穩定支撐天貓雙11,在1秒鐘内系統負載增加了145倍情況下依然保持穩定。在OLAP領域,阿裡雲推出了新一代雲原生資料倉庫AnalyticDB以及雲原生資料湖分析Data Lake Analytics;AnalyticDB是新一代雲原生資料倉庫,獲得了TPC-DS/TPC-H官方認證的優異成績,支撐國稅、郵政、上海城市大腦等超大規模客戶。在NoSQL領域,阿裡雲推出了雲原生多模資料庫Lindorm和雲原生記憶體資料庫Tair。除此之外,我們還建構了企業級資料庫生态工具産品體系,以及雲原生智能化資料庫管控平台。

阿裡雲正在建構一個日益完整的雲原生資料庫産品體系,讓客戶在這個生态體系中用資料庫的方法解決諸多資料處理、存儲分析、計算所面臨的挑戰和問題,這不僅是阿裡雲資料庫的基本出發點,也是客戶學習曲線最低,應用成本最低的一種方案。未來,我們會始終堅持以客戶需求為核心,從客戶視角出發,堅持客戶第一、創造客戶價值,将更多研發力量投入到解決客戶痛點的産品上,讓技術創造新商業。

雲原生應用開發技術圖譜

本課程主要介紹了Serverless和雲開發技術,涵蓋雲開發協同、雲函數、雲資料庫、多媒體托管、前後端一體化架構等Serverless Web開發必備技能,讓你無需保有伺服器即可輕松開發或者遷移本地項目,一鍵部署和上線自己的個人部落格、小程式、以及企業級管理系統等。

點選這裡

,開始學習吧~