天天看點

偶數科技:什麼是雲原生資料庫(Cloud Native Database)?

作者:智成企業研究院

突然間,雲原生資料庫就火了。

根據IDC《2021年下半年中國關系型資料庫軟體市場跟蹤報告》顯示,2021下半年中國關系型資料庫軟體市場規模為15.8億美元,同比增長34.9%,其中,公有雲關系型資料庫規模8.7億美元,同比增長48.7%。Gartner 資料顯示,2020 年全球企業資料庫市場規模達 648 億美元,其中90%的企業資料庫市場規模增量來自雲原生資料庫,2020 年雲原生資料庫市場規模增長率超 50%。

偶數科技:什麼是雲原生資料庫(Cloud Native Database)?

什麼是“雲原生”?

作為一個正在蓬勃發展的新興技術,随着雲原生的不斷發展,關于它的定義可謂是百花齊放。

在2015年,谷歌與Linux基金會聯合創辦了非盈利組織:雲原生計算基金會(Cloud Native Computing Foundation, CNCF),成立初衷為推廣孵化和标準化雲原生相關的技術。根據雲原生計算基金會的描述,Cloud Native的定義如下:

雲原生技術有利于各組織在公有雲、私有雲和混合雲等新型動态環境中,建構和運作可彈性擴充的應用。雲原生的代表技術包括容器、服務網格、微服務、不可變基礎設施和聲明式API。
偶數科技:什麼是雲原生資料庫(Cloud Native Database)?

通過上面的定義,我們可以看到雲原生概念提出的大背景其實是針對應用層的,即我們常說的“雲原生”是“雲原生應用”,而非“雲原生資料庫”。于是很多非資料庫領域的技術人事會将“雲原生資料庫”拆解為“雲原生”+“資料庫”,甚至提出基于容器部署的資料庫才是“雲原生資料庫”,這是一個常見的錯誤認識。

那麼什麼是“雲原生”的資料庫,它是不是“雲上的資料庫”呢?

雲原生資料庫≠雲上資料庫

随着概念的熱炒,很多資料庫把軟體搬遷到雲上便聲稱為“雲原生資料庫”。我們還是要區分一下,雲原生資料庫≠雲上資料庫。

要想了解什麼是雲原生資料庫,我們要知道雲原生資料庫産生的背景。

近年來的數字化轉型使資料的處理和存儲發生了巨大變化。這既是商業邏輯的變化,也是以使用者體驗為中心的轉變。全球各地的企業處理着比以往更多的資料,迫切需要靈活、實用并且可靠安全的資料庫解決方案。大量的技術正在有效地利用雲,并在這個過程中改變我們所有人的業務方式和生活方式,比如,突如其來的疫情使得線上會議會成為商業世界各個組織溝通的“新常态”。

是以,雲原生資料庫是一種通過雲平台建構、部署和傳遞的資料庫服務,可提供可擴充的、可靠的資料庫解決方案。雲資料庫是一個作為服務的雲平台,這種模式允許組織、最終使用者及其各自的應用程式在雲上存儲、管理和檢索資料。

偶數科技:什麼是雲原生資料庫(Cloud Native Database)?

與應用層面相似但卻不同,應用層雲原生将資料剝離給緩存、資料庫、檔案存儲和消息隊列,而資料庫的雲原生隻能将資料庫本身進行存儲和計算分離,存算分離架構是滿足資料庫彈性擴充的重要和必要條件。隻有具備彈性擴充能力才能充分利用雲技術的優勢,是以彈性可擴充是雲原生資料庫的本質。雲上的無限資源為資料庫擴充至成千上萬個節點成為可能,而隻有計算存儲分離架構才能将這種可能變成現實。

“原生”表示資料庫的架構從設計之初就考慮到雲的環境,原生為雲而設計,在雲上以最佳态勢運作,充分利用和發揮雲平台的彈性+分布式優勢。是以說,雲原生架構的本質是存算分離技術。如果隻是把傳統資料庫搬到雲上,而不從架構上進行優化,就不是真正的“雲原生”的資料庫。

雲原生資料庫的價值

說了這麼多,那麼,基于雲原生架構的資料雲平台會為企業帶來哪些價值呢?

我們可以概括為四個方面:降低技術門檻、減少維護成本、提升使用者體驗、節省資源費用。

  1. 降低技術門檻:無論是自建機房還是使用公有雲,都離不開底層大資料技術,大資料技術俨然成為了企業的标配技能,然而并不是每個企業都能組建專業的人才團隊,尤其是一些傳統行業和中小企業。像叢集性能調優等較為硬核的能力,更是很多已經搭建資料平台的企業所缺失的。雲原生技術使得 dbPaaS 為企業提供更好的資料平台服務,正如 Snowflake 所倡導的:使用者不需要調優,隻要按需設定性能參數。
  2. 減少維護成本:即便勉強跨過技術門檻,全方位的運維也是需要企業投入大量精力和資源的。技術運維主要包括但不限于:
    1. 叢集搭建
    2. 叢集擴縮容
    3. 日常運維
    4. 監控告警等

而這些其實都可以作為服務從雲上的供應商獲得。

  1. 提升使用者體驗:假如一個分析查詢使用 10 個節點需要跑 1 個小時得到查詢結果;如果将計算節點擴大 10 倍至 100 個節點的話,同樣一個查詢則隻需要跑 6 分鐘。這兩種配置在公有雲按量計費模式下的成本是相同的,但是使用者的體驗和效率卻可以提升 10 倍。
  2. 節省資源費用:首先我們先要清楚資源是怎麼浪費的,這主要來自兩個方面:
    1. 資料不斷增長讓技術負責人不得不為今後的資料管理留出資源備援,在資料規模接近資源邊界之前,企業的資源都一直處于未完全利用的狀态,這就造成了早期投資的浪費,而當企業資料規模或者應用場景增多,往往是計算資源提前耗盡而無法有效支援業務場景;
    2. 另一方面,即便在一段時間内資料規模和應用場景變化不大,不同時段的資源利用水準和需求也不一樣,比如白天和夜晚、工作日和休息日,平台資源都處于不同程度的閑置狀态。

是以,節省資源費用必然要從彈性擴容縮容出發,雲原生技術在彈性方面具備天然優勢,這也是為什麼國外各大雲廠商和獨立資料庫廠商都提供了雲原生資料庫。

雲技術和資料庫的融合,正在突破過去基于實體伺服器部署的傳統資料庫存在的高成本、低效率、穩定性差等諸多問題,為使用者提供高彈性、分布式、低成本的使用體驗。

雲原生資料庫中的模範生 - OushuDB

新一代極速雲資料庫OushuDB 由偶數科技自主開發,偶數科技的核心研發團隊曾主導國際頂級的資料庫開源項目。依托與OushuDB的雲原生特性、計算存儲分離架構、強事務特性、完整SQL标準支援、高性能并行執行能力等一系列底層技術的變革,可以實作高彈性、高性能、強擴充性、強相容性等上層技術的變革,最終幫助企業有效應對大規模、強敏态、高時效、智能化的趨勢,輕松建構核心數倉、資料集市、實時數倉以及湖倉一體資料平台。

偶數科技:什麼是雲原生資料庫(Cloud Native Database)?

相對于其他傳統資料庫廠商,OushuDB 有非常多的優勢,其中Top3為:

  • 彈性。OushuDB 包含計算層和存儲層,存儲和計算分離,可以獨立擴容。一個 OushuDB 的計算層有多個 OushuDB 主節點,内部包含了資源管理服務等。
  • 高性能。基于領先的性能優化技術打造的世界上最快的分析型資料庫。具有極速執行器,提供PB級資料互動式查詢能力,比傳統數倉/MPP快5-10倍,比Hadoop SQL引擎要快5-30倍。
  • 雲中立。支援 AWS、Azure、阿裡雲、騰訊雲、金山雲等大廠的統一資料管理方案,也可結合私有雲進行混合管理。不同于Snowflake隻提供公有雲領域的雲原生服務,偶數科技的雲原生架構既能夠滿足公有雲、也能夠支援私有雲服務,尤其對于國内市場如今依舊占比較高的私有雲領域,偶數科技也可以提供優秀的支援。

OushuDB 還有很多其他的特性,大部分都是為了提高資源使用率,進而為客戶降本增效。偶數科技認為,一個優秀的雲原生資料庫應該具備良好的彈性擴充能力,而“是否做到存儲和計算的完全分離”以及“産品執行引擎是否完全彈性”是判斷一個雲原生資料庫的基本标準。隻有具備這兩點,一款資料庫産品才能稱得上真正發揮了上雲的優勢,才可以将資料和雲更好地融合在一起,就可以說自己做好了雲原生”。

⌈偶數科技⌋ 是一家領先的雲數倉和AI産品提供商,緻力于賦能全球各行業客戶。公司的願景和使命是 “讓人類隻為興趣而工作”。偶數科技的産品已在金融、電信、制造、公安、能源和網際網路等行業得到廣泛的部署和應用。目前偶數科技已經獲得世界頂級投資機構紅杉中國、騰訊、紅點中國與金山雲的四輪投資。是微軟加速器和騰訊加速器成員企業,并入選福布斯中國企業科技 50 強和美國著名商業雜志《快公司》中國最佳創新公司50強。(内容來源:偶數科技)

繼續閱讀