天天看點

AI時代資料庫如何Ready?TiDB率先給出答案

作者:大資料線上

當ChatGPT橫空出世的那一刻,很多行業都為之一震,意識到變革時刻已經到來。

資料庫是最早“覺醒”且付之行動的領域之一。業内普遍認為,大模型所呈現出的強大能力,讓Data+AI成為資料庫領域的大勢所趨。大模型與資料的同頻共振,不僅會對目前的資料庫技術架構帶來根源性重構,更有望讓資料庫市場形成差異化的競争,帶來無限可能。

是以,從今年上半年起,DataBricks等國外資料庫廠商均在加碼Data+AI,而中國資料庫企業也不逞多讓,PingCAP、阿裡雲、華為雲等多家企業紛紛出手,快速響應Data+AI的趨勢。

正如PingCAP創始人兼CEO 劉奇在最近的 PingCAP 使用者峰會 2023 上所言:“AI正在重塑軟體行業,資料庫需要從架構上更系統地做到 AI ready。當資料庫架構做到算算分離、存存分離、存算分離時,非常容易引入AI。”

AI時代資料庫如何Ready?TiDB率先給出答案

PingCAP創始人兼CEO 劉奇

Data+AI,資料庫差異化的東風

凱文凱利在《未來十二大趨勢》中認為,現在我們處于一個資料流動的時代。商業乃資料之商業。歸根結底,你在處理的都是資料。

的确,随着資料成為新的核心生産要素,企業的研發、供應鍊、營銷、服務乃至創新均在以資料為基礎進行全方位重塑,而AIGC、大模型和通用人工智能技術的不斷疊代與演進,則有望帶來生産力的飛躍。Data+AI的持續融合,将對資料和資料庫帶來由表及裡的巨變:

首先是資料消費門檻以前所未有的速度下降,人人用數不再是遙不可及的願景。随着大模型所展現出的強大能力,以及NLP to SQL、Text to SQL取得的極大進步,資料使用的互動革命正在發生,資料的使用、消費不再是資料科學家等專業人員的專屬,資料消費門檻大幅降低。

而當人人用數成為現實,意味着資料的整合、查詢、分析和應用等操作将會呈現出指數級的增長趨勢,這無疑會對資料庫産品的架構、性能以及可靠性等帶來颠覆性的改變。

另一個顯著變化就是,随着資料消費成為企業數字化轉型中的一種新常态,資料庫自身需要走向服務化,屏蔽複雜技術與操作,借助AI使能讓資料的管理、使用和操作需要智能化和自動化,以響應資料消費的新趨勢。

“無論技術世界如何變化,穩定性、性能、高可用、易用性與工具生态,永遠都是使用者對資料庫的重要關注點。我們應該走向資料庫的服務化,而不是服務化的資料庫。”PingCAP創始人兼CTO 黃東旭直言道。

AI時代資料庫如何Ready?TiDB率先給出答案

PingCAP創始人兼CTO 黃東旭

筆者認為,Data+AI融合的這股東風,在加速推動資料庫産品、架構走向重塑之際,中國資料庫企業需要抓住機會實作産品、市場等全方位的突破。衆所周知,因為政策紅利的出現,中國市場過去幾年湧現出一大批資料庫相關企業,一方面說明資料庫市場的潛力巨大,另一方面也反映出資料庫産品同質化嚴重的情況。在技術變革之際,“偏安一隅”享受政策紅利并不是長久之計,唯有在資料庫核心架構實作領先,并紮根市場使用者需求,方能真正走出資料庫産品的差異化之路,進而實作市場的全面突破。

面對Data+AI的浪潮,PingCAP率先給出答案。在PingCAP 2023使用者大會上,PingCAP正式推出新一代架構的資料庫:TiDB Serverless。劉奇直言:“TiDB Serverless于四年前開始預研,經過四年的打磨正式釋出,在架構層面滿足AI時代帶來的各種資料處理新需求。”

資料庫加速走向AI Ready

資料庫如何加速走向AI Ready?可以說,雲原生是繞不開的話題。

衆所周知,随着雲計算的廣泛普及,大量傳統政企行業使用者開始上雲與用雲,以及在AI技術應用的推動下,一個全面雲原生化的時代已經來臨:從基礎設施到應用開始全面走向雲原生化。這其中,資料庫又是一個重要抓手,資料庫從單體到微服務架構再到 Serverless 架構的持續演進,響應了全面雲原生化的需求變化。

如果說雲原生是資料庫走向智能化的基礎條件,那麼AI則是雲原生資料庫持續演進的牽引力。就像新能源+智能化在重塑汽車行業一樣,雲原生和AI也在深刻影響着資料庫的架構與産品。

AI時代資料庫如何Ready?TiDB率先給出答案

以TiDB Serverless 資料庫為例,其實作了複雜事務的自動化處理,大幅簡化了應用的開發,使用者不必再花費大量時間在資料庫各項處理上,進而可以将精力投入到業務創新之中。

據悉, TiDB Serverless采用雲原生/多雲的設計理念,擁有雲原生引擎 CSE(Cloud-native Storage Engine)架構,可以實作無需資源規劃、秒級啟動、0 元起步、按使用付費、極緻彈性的資料庫服務;TiDB Serverless的關鍵元件則采用了全分離設計,不僅具備自動化的資源排程能力,還能夠靈活內建AI能力;另外,Chat2Query等新功能大幅降低了資料消費門檻,在資料庫與資料消費端形成良好的對接。

“TiDB Serverless适用多重的應用場景,使用極為便捷且能做到高效的成本控制。”劉奇介紹道:“從去年底上線短短幾個月時間,TiDB Serverless beta 版就擁有超過1萬個活躍叢集。”

Gartner預測,到2025年,雲原生負載占比将達到95%,未來幾年新增雲原生應用占比将持續提升。筆者認為,在一個全面雲原生的時代,以及AI應用需求的推動下,傳統資料庫廠商将逐漸失去原有的優勢,而生于雲、長于雲、基于雲原生架構的資料庫将成為市場的中堅力量。“資料庫正在全面融合Serverless、AI等趨勢,TiDB Serverless可以和 HTAP、AI 融合,形成三位一體的創新優勢。”PingCAP副總裁劉松表示道。

但這并不意味着誰都能很快推出真正的雲原生資料庫。衆所周知,資料庫長期以來都是一個工程化程度極高的領域,雲原生資料庫不僅需要在初期技術路線選擇上具有前瞻性,還需要持續和反複打磨産品。毫無疑問,PingCAP在資料庫架構的先進性、AI技術的融合等方面走在了業界的最前列,為中國資料庫産品率先探索出一條領先之路。

劉奇認為,資料庫與AI的結合還有巨大的探索空間,比如工作負載預測、資源智能化配置、資料分析等等,“小模型可能會在資料庫很多環節中發揮巨大價值。小模型現在進步非常快,也更加專用和合規,尤其是小模型推理能力的持續進步,将極大推動AI在資料庫領域的可用性。”

紮根中國,實作業務與技術價值的雙向奔赴

IDC表示,2022年,中國市場所産生的資料庫規模達23.3ZB,全球占比達23%,有望在2026年成為全球最大的資料圈。随着數字中國建設的穩步推進,數字經濟、産業數字化的加速發展,将持續帶來資料規模爆炸性增長和資料應用快速深化,也必然對于資料庫的創新提出了更高挑戰。

在筆者看來,未來五年是中國資料庫産業突圍的關鍵期。随着中國千行百業數字化程序的不斷深入,中國市場的業務規模、業務的複雜度以及市場需求将在全球無出其右。例如,中國已經有多家銀行等金融機構的App達到月活使用者(MAU)億級規模,金融機構的營銷、客服服務、風險控制等業務中大量基于資料和AI技術來實作……種種變化,使得中國資料庫市場在經曆了宏觀政策驅動的因素影響後,未來市場會真正以先進技術驅動為導向。

毫無疑問,PingCAP今年對于市場和産品政策的調整,有望讓其更好地深耕中國市場,利用先進技術與架構的資料庫産品助力千行百業的數字化轉型。

首先,PingCAP形成了更加清晰的市場與産品政策,通過TiDB 企業版、TiDB Cloud、TiDB Serverless三大産品,以及針對中國市場的平凱資料庫,來滿足不同市場和使用者群體對于資料庫的使用需求,在市場中的打法更加明确與聚焦。

其次,PingCAP多條産品線均是基于TiDB一個核心核心的基礎,不同産品雖然市場定位不同,但均保持了核心的先進性。以面向中國企業使用者的平凱資料庫為例,在基于TiDB Open Core的基礎上,增加了國産化基礎套件、企業級安全套件等大量的企業級特性,契合中國企業級市場的各項差異化需求。

AI時代資料庫如何Ready?TiDB率先給出答案

最後,PingCAP在國産化生态、傳遞與服務體系化等方面進行持續的完善,平凱資料庫對于國産化生态相容等投入大量精力,在滿足中國企業數字化轉型需求的同時,也確定先進的資料庫産品能夠在本土技術生态體系中得到充分的發揮。

“平凱資料庫脫胎于TiDB企業版。TiDB企業版經過五年打磨,過去更多是面向全球使用者提供通用性功能,但這對于中國企業級使用者還遠遠不夠。平凱資料庫的推出,可以為中國企業級使用者帶來長期的價值。”劉奇最後表示道。