天天看點

36氪專訪華瑞指數雲:SDS進入2.0時代,漸進式疊代以10年為周期

作者:36氪

整理 | Ricky

作者 | 王與桐

軟體定義存儲(SDS),并不是個新概念,但是在創投圈子卻還是年輕的。

該概念發展至今已有十餘年的曆史,相關的技術和産品在2010年前後開始進入商用市場,初期主要用于網際網路等行業,具體場景是需要海量資料存儲、高通路并發量、但是對資料的可靠性和一緻性要求并不苛刻等業務場景。

在2015年左右,随着雲計算的普及,以及移動網際網路進入井噴期,資料量急劇增加,是以軟體定義存儲/分布式存儲開始在企業級市場得到大量應用,尤其是在虛拟化和雲計算環境中,存儲資源需要池化和彈性擴容,軟體定義存儲搭配普通伺服器硬體組成分布式存儲叢集成為當然之選。由于分布式架構和軟體定義帶來的諸多優勢,SDS也被公認是資料存儲系統的未來發展方向。

從SDS技術的現實情況來看:

一方面,SDS在公有雲平台上得到了廣泛的應用。目前所有的公有雲大平台,它們的存儲架構都采用的是軟體定義存儲架構,不會有任何公有雲使用以EMC為代表的傳統存儲架構。

另一方面,目前整個企業級市場在存儲領域的投資仍然集中在傳統存儲架構上,采購的也大都是傳統的存儲産品。而華瑞指數雲主要是面對企業級市場,目前SDS的市場佔有率占比還比較低,并且主要應用于中低端業務場景,但是随着企業IT架構的現代化更新和演進,未來增長空間較大。

另外,SDS本身也需要疊代更新——從1.0進化到2.0——這也是華瑞指數雲想要做的。

36氪此次采訪了華瑞指數雲聯合創始人&CTO曹羽中,以及華瑞指數雲早期投資人明勢資本董事總經理徐之浩。曹羽中曾任華為公司雲與計算BG 西歐區 CTO,華為公有雲創始核心專家,華為私有雲首席架構師,美國IBM私有雲産品SCE首席架構師等,對雲計算賽道以及軟體定義存儲賽道有着縱深的了解和廣闊的視野。他将從“科普”的角度,解釋SDS是什麼,為什麼我們要進入SDS2.0時代。

以下是對話實錄,36氪整理:

36氪:軟體定義存儲這個行業還在發展過程中,能不能先簡單介紹一下該行業的基本情況。

曹羽中:軟體定義存儲這個概念已有十餘年的曆史。從技術願景的角度來說,自從這個概念推出以來,整個産業界都認可這是存儲領域的發展方向和未來,比如Gartner從2015年起一直到最新的2022年,在其每年釋出的“存儲和資料保護技術周期報告”中都把SDS列為存儲領域的變革性技術,甚至是唯一的變革性技術。

從該技術的現實情況來看:一方面,它在公有雲平台上起到了很大的作用。目前所有的公有雲大平台,它們的存儲架構都采用的是軟體定義存儲架構,不會有任何公有雲使用以EMC為代表的傳統存儲架構;另一方面,目前整個企業級市場在存儲領域的投資仍然集中在傳統存儲架構上,采購的也是傳統的存儲産品,SDS産品雖然也開始在一些企業廣泛部署使用,但是主要應用于中低端業務場景,它們并沒有選擇大步朝軟體定義存儲的方向邁進,在我看來,這是一個錯位。

公有雲全部采用了SDS方向的技術,但企業市場并沒有。我們團隊曾經長期從事公有雲IaaS層分布式基礎軟體的研發,最大的願景是用軟體定義存儲的架構真正改變企業對其的抵觸心态。

另外一些比較深層次的原因,軟體定義存儲在企業級市場上并沒有大廠家出現,傳統存儲巨頭很難從戰略層面對SDS産品進行大規模投入,大型公有雲廠商主要把SDS當作整體IaaS底座的一部分。這也預示着這是一個會有很大變革機會的領域。

從IT基礎架構的發展來看,存儲架構與計算架構是需要配套發展的。從計算架構的角度來說,其實已經大步邁向分布式架構,微服務架構,分析型引擎,資料驅動計算等新範式,整個企業級應用都在朝向雲原生應用發展。但是對于存儲架構來說,在今天的線下的企業級資料中心市場,很大一部分投資還是在集中式架構,硬體形态為主的傳統存儲陣列,雖然也有一些企業已經部分采用了SDS,但隻用承載外圍的中低端應用,隻占其存儲投資的小部分,沒有進入的主流賽道,遠遠不足以驅動企業資料架構的大變革。

我們團隊希望使用軟體定義存儲的架構完成整個企業級存儲架構的演進,讓它變成一個統一的SDS架構,進而支撐起整個企業的資料底座,我們計算架構的雲原生架構以及應用架構将向新的應用形态演進,整個趨勢都能把它比對起來,這也是我們的總體方向。

36氪:SDS分布已經從1.0時代發展到2.0時代,可以詳細地介紹一下二者有哪些差別嗎?行業的哪些變化又導緻了這些差別的産生?

曹羽中:SDS1.0誕生的這十多年時間裡,其被貼上了中低端存儲的标簽,沒有進入企業存儲的中高端市場,更不足以成為真正的企業級存儲架構的變革者和主流選擇。

第一代SDS軟體(SDS 1.0) 起源于18年以前,開源Ceph軟體為典型代表,随着網際網路,雲計算和大資料時代的到來獲得了較為廣泛的采用,但是第一代SDS軟體(SDS1.0)存在先天不足——面向慢速硬體和網絡時代設計,存儲系統的IO處理效率局限性明顯,IOPS低、時延大,性能穩定性和可靠性都難以比對企業關鍵業務的需求,且進化速度也比較緩慢,SDS 1.0不可避免地進入了瓶頸期。

存儲産品最重要的幾個性質是可靠性、性能與時延。盡管1.0版本理念與方向是先進的,同時天然地貼合企業未來發展,可惜在上述三項核心能力上沒有達到集中式架構應有的水準。是以我們提出2.0的新概念。SDS 2.0作為新一代存儲系統軟體,首先需要适應新興的高速硬體和網絡技術的要求,通過軟體層IO棧的颠覆性的改變,實作IO處理效率的數量級提升,能夠充分的壓榨出新一代硬體的極限性能,能夠通過軟體技術創新,而不是依賴于專屬硬體設計,來提升系統的總體可靠性,故障容錯能力和故障恢複的效率,在IOPS,時延,可靠性等存儲系統的核心名額上,能夠達到替換傳統高端存儲陣列的水準。其次,面向海量資料處理場景,需要提供高吞吐,大并發,性能和容量的線性擴充能力,支撐高性能,低延遲時間的資料實時分析處理。第三,企業在數字化轉型過程中,會經曆一場深刻的轉變,從以應用和業務流程為驅動,轉變為以資料為驅動,企業迫切需要建構新一代資料基礎設施,能夠實作資料的天然的共享存儲,共享通路,統一管理和智能流動,還能更好地滿足資料跨越混合多雲及邊緣的應用需求。為了滿足這樣的需求,SDS2.0作為一個統一的存儲系統軟體,需要從架構和中繼資料管理層面有充分的前瞻設計和全新的工程實作。

36氪:關于SDS疊代,為什麼會從1.0時代進化到2.0?

曹羽中:我從兩個方向回答。一方面,是需求側發生的變化;另一方面,是技術側發生的變化。

從需求側來說,一個是AI,另一個是國内的信創,需要我們核心的系統或資料庫搬到國産自主可控的大平台上,存儲技術就包括其中。企業IT雲化轉型走向深入,會把更多的企業關鍵應用,核心應用,各類圍繞着OLTP資料庫建構起來的系統遷移到國産自主可控的雲化平台上,在這個過程中,雲平台對于軟體定義存儲技術提出了更高的要求,需要軟體定義存儲具備以軟體定義的方式去替代各類傳統存儲和全閃陣列的能力。 數字化技術和AI的廣泛采用,将推動大資料的分析和應用由原來的批處理走向實時資料分析,将需要存儲層在應對海量資料存儲高并發通路的同時,提供更低的IO讀寫時延。從存儲系統的信創角度,我們并不能僅僅滿足于研發同質化的産品實作對國外存儲系統的平替,信創存儲産品能夠借助軟體定義存儲的架構實作彎道超車,換道超車,實作大陸在企業存儲領域的超越。

從技術側來說,首先計算範式發生了很大的變化,比較明顯的是原先的算力主要通過CPU形式來提供,往後更多的通過GPU這類更專用的硬體形式提供。GPU極大的提升了資料的并行處理能力,與CPU讀取和處理資料的方式是很不一樣的,需要有跟它的并行處理能力相比對的資料底座。就比如取外賣時隻有一個外賣架投入使用,在外賣不多時是可以滿足需求的,在GPU運算時代,可能相當于整個公司的人都同時去取外賣,原先的外賣架就不能滿足需求了。

過去十幾年來,硬碟媒體和網絡等基礎硬體發生了很大的變化。譬如存儲媒體已經實作了大規模的從機械硬碟向SSD固态硬碟的過渡,由此帶來了硬體層面的超高IOPS和超低延遲時間,新興SSD媒體相比磁媒體,性能提升了1000倍,通路時延下降了數百倍,達到了10us級;網絡帶寬由過去的10M和100M已經提升到現在的10G和100G, 提升了1000倍,随着RDMA等新興技術的出現,網絡通路時延已經下降數百倍,達到了10~20us的水準。然而,目前市場上主流的第一代SDS的IO軟體棧還是采用的15~18年以前的系統架構,處理單個IO的時延會達到幾百us之多,比今天的網絡和媒體要慢一個數量級,軟體IO棧已經成為了整個資料存儲系統的主要瓶頸。

打個比方,2005年的遊戲是沒有辦法把2023年的電腦跑滿的,硬碟,網絡等處于一個很閑的狀态,也沒有辦法把今天的3090,4090顯示卡充分的用起來給使用者帶來優秀的體驗。客戶花錢買下新一代硬體,但可能硬體上隻有10%左右的潛力被挖掘出來,還有90%的IO能力被閑置,這不就是一種資源的巨大浪費嗎。

其實我們可以這麼說,通用标準硬體發展到現在這個階段,再加上軟體技術的完整革新,在存儲領域我們已經具備用SDS軟體+通用标準硬體完全替換掉集中式架構的高端存儲陣列的能力了。

36氪:您提到的“硬體到目前這個階段”是從什麼時候開始的?

曹羽中:硬碟媒體方面,NVMe SSD相比傳統的機械硬碟HDD,從性能,時延,可靠性等次元都是遠遠優勝,除了成本。實際上最近這幾年NVMe SSD的每TB成本一直在下降,大家對它的預期是等NVMe SSD的成本進入到所謂的颠覆點,到了這個點之後,企業的熱資料存儲乃至溫資料存儲都不會再采購機械硬碟,企業采購全閃媒體的投入就會大于HDD上的投入,企業資料中心的全閃時代就到來了。這個時間點預期在未來幾年就會出現,當SSD的成本下降到某一點時,整個企業級市場就沒有再去采購HDD作為主存儲媒體的理由。就像筆記本電腦實際上就已經發生類似的事情,從某個時間點起,所有的筆記本電腦裡就都沒有機械硬碟了。

企業資料中心網絡的大變化其實很快也會發生。基于RoCEv2協定的RDMA正在走向大規模成熟商用。目前的新一代25GE以太網交換機和網卡中,RoCEv2幾乎已經是标配了,随着企業網絡從10GE向25GE的更新,企業資料中心網絡大範圍支援基于RoCEv2協定的RDMA網絡是在幾年内即将發生的事,RDMA網絡的超低延遲時間,将極大的利好于分布式架構和存算分離架構,也為分布式的SDS軟體在要求高性能和低延遲時間的業務領域去平替集中式存儲提供了現實基礎。

技術此消彼長時就會出現交叉點,我們已經看到了交叉的趨勢,等待交叉點的到來。在硬體更新的交叉點到來時,我們希望通過實作SDS軟體的換代更新,使SDS這樣的産品形态有能力切入企業更核心,更高端的業務系統,進而實作SDS換代替換傳統硬體盒子式的存儲産品的交叉點。

36氪:是以我可以了解為,目前這個領域仍處于市場教育的階段,你們現在所做的是搶占視窗期,等到時間點到來的時候,你們已經成為占領市場的一方?

曹羽中:現在NVMe+RDMA網絡這樣的硬體組合還屬于比較高端的市場。隻有在比較高端的業務場景裡,客戶才會考慮掏錢購買NVMe SSD加RDMA網絡這樣的配置。但是如前所述接下來幾年這個配置就會成為一種硬體采購的标配,會成為一個通用的主流市場。這種情況下,我們的新一代SDS2.0這樣的軟體架構産品的市場規模、可以觸達的客戶業務場景将會快速擴大。

現在我們和客戶談的是,在今天主流的普通機械硬碟HDD加10GE TCP/IP網絡的硬體條件下,我們的SDS2.0軟體相比市場上的SDS1.0産品也會有幾倍的性能提升,但它還不是颠覆性的,但是當你硬體環境進化到NVMe SSD+RDMA網絡的層次,SDS2.0軟體架構相比市場上的SDS1.0軟體的性能提升将達到幾十倍,是碾壓式,颠覆性的提升,故障恢複速度,可靠性的提升也将是巨大的。客戶幾乎沒有任何理由在NVMe SSD+RDMA網絡這樣的新一代高速硬體上使用低速的SDS1.0時代的SDS軟體。

36氪:SDS2.0與AFA的關系是?

曹羽中:在過去的行業認知裡,SDS産品是低端存儲,FC SAN混閃陣列是中端存儲,AFA全閃陣列是高端存儲。我們推出SDS2.0産品WDS,是軟體定義的分布式架構,但是完全攻克了過去分布式存儲架構IOPS低,時延大,時延不穩定的固有缺點,從IOPS,時延,可靠性等核心名額上來評價,是可以達到乃至超越AFA高端全閃陣列的水準的,可以作為AFA的一個更現代化的替代品。SDS2.0又不僅僅是對AFA的平替,WDS有許多AFA做不到的能力,比如純軟體傳遞,容量水準擴充,性能線性擴充,自動化的資源排程,與雲化環境/雲原生環境的無縫融合,無特定硬體依賴,業務無損的無縫更新擴容,與計算引擎的協同優化,資料的池化和智能流動等等。是以SDS2.0在企業存儲架構的現代化演進上面将扮演主要的角色。

打個比方,假設一個很極端的場景,華為雲或者阿裡雲使用AFA的存儲架構,如果使用者需要申請網盤,它們做的事就是往裡頭堆一根線,說:“兄弟,hold住,我往那堆一個機器,堆完以後再接到裡面去。”然後再打個電話給客戶說:“兄弟,現在可以使用了,你用的是什麼端口?”

極端一點就是這樣。為什麼全球的大型公有雲平台不采用AFA這樣的存儲架構和産品去承載企業級應用呢?有成本的因素,采購商用的AFA産品很昂貴,硬體的備件更換等等也需要采購專門的硬體,顯著的增加了備件采購成本和運維成本。更重要的是技術上的考量,因為傳統的AFA架構首先是一個硬體,由管理者基于複雜的配置去定義和建立所謂的LUN,它與雲計算所要求的完全自動化、API驅動、靈活彈性擴充和資源池化共享是格格不入的,從運維監控的角度,AFA也沒有辦法完全融入雲平台的自動化監控運維體系,擴容更新等運維操作将非常複雜,從資源共享和資料共享的角度,一套一套的AFA本質上就是割裂的資料孤島,無法滿足存儲資源池化共享和資料智能流動的需求。

36氪:這涉及到另一個老生常談的問題,剛才提到企業替代AFA的成本是昂貴的,同時你們主打企業級市場,對于你們的客戶來說,它們有動力去完成替換嗎?

曹羽中:幾個驅動力:

第一,整個業務架構要向雲架構轉型,這是業務領域很重要的驅動力。AFA跟雲化架構,雲原生架構的需求無法完全比對。

第二,從節約成本的角度來說,随着資料量越來越大,客戶需要的存儲空間與性能也越來越大,在這種情況下,如果完全用AFA硬體架構來搭建,總的成本會是一個天文數字。這是無法支撐的。

第三,是新興業務形态,以GPU計算、以實時資料分析或AI訓練為代表的業務場景,資料量不僅大,同時又要求高性能和高吞吐,這種情況下使用AFA極度不經濟,這些新型業務形态天然地需要分布式的SDS架構。

是以這是三個主要的驅動力:即老業務雲化的需求、成本驅動和新興業務場景,這都是SDS2.0比較完美适配需求的地方,是以企業的動力是很充足的。

另外,也不用局限在平行替換現有AFA這個點上,更重要的是面向未來的發展如何建立,企業如何采用新的思維,新的架構去建設其下一代的存儲架構,乃至一個統一的存儲平面和資料底座,這個是SDS 2.0能夠帶給企業客戶的更大的價值。

36氪:像您剛才提到的,目前這個行業裡有很多痛點,它需要新的架構去解決,為什麼其他的公司或者說其他的這些技術人沒有發現問題,沒有想到用這種改變。

曹羽中:這裡有幾個因素。

一個是本身技術能力沒那麼強的公司比如創業公司或一些大廠,他們技術發展思路基于某開源元件的修改,然後去優化性能。可1.0的軟體架構再怎麼修改也不是2.0的,它永遠都是一個漸進式的修補。這一類廠家對技術本身缺乏把控能力,他們沒有勇氣、架構能力和工程能力去抛開原有的開源架構去設計2.0架構,并使它真正地工程落地,這是做不到的。這一類廠家可以歸結為”能想得到,但做不到“。馬車再怎麼樣做優化修改,也成為不了汽車。

第二類廠家已經想到,并且也在做。這些廠家以公有雲為代表。我們本身是公有雲團隊,我們有能力做這件事情,是因為我們在過去10多年一直從事雲底座的研發,經曆了這方面的思考和工程實踐。目前在做這件事情的有幾個公有雲巨頭。

公有雲需要通過SDS架構去承載越來越多的企業業務,不會借助AFA這種硬體架構來完成這件事。是以,他們有很多業務壓力來迫使他去做這件事。目前阿裡華為還有其他雲巨頭,對底層的 SDS架構做了大量研發和更新。但其中的問題是以公有雲平台為中心進行設計實作,這意味着它很難線下産品化傳遞。阿裡雲沒有辦法把它以輕量化産品化的方式搬出,賣給某一個企業使用。從架構設計的一開始,他就沒有針對這種目标,也由于沒有針對這種目标,他們的架構需要對硬體進行依賴。

公有雲講究以最快的速度推出,很多性能不足的地方,需要硬體進行補充,他們天然就會采取這種措施。公有雲的存儲架構裡,底層可能使用類似傲騰這樣的硬體做加速。對于客戶來說,客戶并不想買傲騰。這就是公有雲的問題所在,它面向雲平台架構,為雲服務而設計,規模比較大,有很多依賴。

第三類廠家是傳統存儲巨頭,以EMC為代表。它們有相關的技術能力與資源,沒有這方面人才也可以再招。它們沒有來做這件事情最重要的因素是定位問題。傳統存儲端已經做了分布式架構,但不能做成軟體定義存儲這類分布式的存儲,因為它不提供純軟體的互動形态。這是基于商業政策來考慮的,是以不提供軟體,而是提供完全一體化的産品,這是第一個缺點;第二個缺點是,傳統巨頭将其集中式存儲架構定位為中高端系列面相核心資料,把分布式存儲體系定位為中低端系列面向海量資料。從産品定位就畫了一條線,他們就沒有動力、投入和決心。他不會用左手去打自己的右手,雖然現在是左右兩個手都硬。這也是EMC和華為這些公司的政策,沒有變革的巨大推動力。因為兩條線都是市場的主要玩家,有着比較高的市場占有率,是以不會産生變革性投入。這跟所有大廠很難做颠覆性創新是一個邏輯。颠覆性的東西不會砸資源把它完成,大概就是這麼一個市場格局。

36氪:你剛才提到企業存儲架構有更新疊代的必要性,從企業客戶的角度考慮,他們會選擇什麼時候進行更換,你們有考慮過這個問題嗎?

曹羽中:這是漸進的,不是一蹴而就的。就像現在使用雲化架構去替換企業現有架構,一定是小幅度地試探,一點點推進。而不是一夜之間把原先的AFA全部扔掉,換成SDS2.0這種産品。

36氪:是以你們現在有看到他們一點一點地在試探是嗎?

曹羽中:各行業的企業正在把越來越多的業務做雲化,做分布式改造,做雲原生改造,做基礎架構硬體的标準化,這個事情一直在推進。剛開始可能是開發測試業務,外圍的業務,然後再做普通業務系統,最後再到準核心,核心業務系統,他會一步一步向前演進,在這個過程中,他會進一步思考他總體系統架構,計算架構,存儲架構,資料架構等。

當SDS2.0這樣的産品出現之後,由于這是一個面向未來的新一代技術,具備各方面的優勢,又可以支撐目前必須要用AFA才能承載的業務,這時企業就有機會有意願選擇SDS2.0而不是傳統存儲和AFA,并且還可以考慮采用SDS 2.0的技術方案建構企業的統一存儲底座,徹底改變過去為不同的業務系統采購和部署不同的存儲硬體的堅井式建設模式。這個過程需要有一定的總體規劃,但是肯定是需要逐漸去落地的,就像我們說的去IOE,這絕對不是一夜之間完成的,需要慢慢往前推進。

36氪:說到國産資料庫替代Oracle,可能現在我們很多的國産資料庫,包括一些分布式資料庫或者開源資料庫,放了很多新的技術概念在其中。他可能适合很多新的場景,但其實跟Oracle相比,他們有不夠穩定的問題。這可能是很多企業沒有辦法下定決心從Oracle切換到國産資料庫的一個原因。作為一個創業公司研發的創新産品,穩定性不如市場主流成熟産品是完全可以了解的,但從客戶的角度來說,他們不會因為是新成立的公司就花錢為産品的不穩定性買單。是以我想了解一下華瑞是如何考慮這個問題的?

曹羽中:這是一個非常關鍵的問題。從技術方面來說,我們具備領先的優勢和面向未來的産品,但阻礙我們的産品真正的走向大規模的生産應用的最核心因素之一就是你所提到的“穩定性”。企業客戶對于産品穩定性的擔憂,有時候是對技術架構不了解引起的,有時候又僅僅表現在心理作用,對于沒有經過長時間的市場驗證的産品的一種不安全感。

先從技術的角度來說,SDS軟體作為分布式架構,它本身從可靠性與穩定性的設計上與存儲陣列,AFA完全是不同的思路。存儲陣列,AFA的硬體是專門設計的,更多的依賴硬體的可靠性,硬體的備援來實作全系統的可靠性,穩定性和可靠性确實是高端存儲陣列經過長期市場考驗建立起來的口碑。

我們的SDS産品作為分布式架構軟體,跑在通用硬體上,其穩定性和可靠性的設計邏輯是首先假定硬體是不可靠的,更多的是從軟體層面來整體實作全系統的可靠性和穩定性。分布式系統的系統架構原則是沒有單點故障,具備故障容錯能力,具備故障自愈能力,能夠及時識别有故障的硬體,亞健康狀态的硬體,将這些硬體踢出叢集,在這個過程中,對上層業務不産生任何影響。在我們的SDS2.0軟體架構中,我們在軟體層面實作了更多的可靠性和穩定性保障措施,比如極速的分布式複制狀态機,能保證資料的強一緻性同時又具備10微秒級的資料複制時延,可以提供極速的故障恢複能力,通過副本資料比對,端到端dif, 多級故障域,分布式鍊路追蹤等多重手段來進一步保障資料的可靠性和一緻性。

其次呢,通用硬體本身的可靠性其實也一直在提升,比如NVMe SSD媒體的可靠性就比機械硬碟高幾個數量級,普通x86伺服器的可靠性也一直在提升。20多年前,業界曾經普遍認為x86伺服器是不夠可靠的,企業的核心業務一定是要跑在小型機上才放心,但是在過去的10年來,我們看到幾乎所有的企業都在把核心業務從小型機上下移到x86平台上來,小型機逐漸在市場上消失了。是以我們堅信,SDS軟體+通用硬體,在可靠性和穩定性上面追上乃至趕超高端存儲硬體是一定會發生的。

第三點,SDS作為分布式架構軟體,是更容易與雲化環境融合形成互動的。因為雲原生架構的上層業務注重資源的彈性伸縮、快速建立,重新開機和删除。作為雲原生架構的SDS存儲能夠更天然地與雲原生應用産生互動,應用層很容易實作存儲資源感覺和自動化管理,然後可以采取計算和存儲關聯的一些可靠性措施,這種更高層面的系統可靠性也就超越了傳統高端存儲陣列所強調的存儲可靠性了。

至于企業客戶選擇新産品的心理擔憂的問題,是需要一定的時間來解決的。實際上企業客戶乃至具體的資訊化技術負責人有很多種類型,有的保守派,有的是追随者,有的是激進派。現在有很多企業客戶有切實的痛點,如果再加上在選擇産品方面并不保守,在新技術上面願意大膽嘗試,這些就是我們理想的早期客戶,我們需要這樣的客戶幫助我們破冰,去培養市場的聲譽和口碑。當然,我們本身從産品和技術層面是要做好充分的可靠性保障的,包括建設完備的運維能力和售後維保體系。在業務有痛點需要解決,新産品本身可以帶來顯著的價值的基本前提下,我們相信品牌和信任是可以逐漸建立起來的,企業客戶的認知和産品選擇習慣是可以逐漸改變的。當然,這個一定需要一個比較長的周期,這也是為什麼我們認為在企業級市場要發生一次真正的技術變革需要一個10年的長周期。

36氪:關于你們跟一些硬體廠家的合作,具體是如何做的?比如你們的産品的極速性能是需要在某些固定的硬體上才能發揮作用嗎,還是在通用硬體上都可以,合作的形式是怎麼樣的?

曹羽中:首先作為一款基礎軟體,我們最重要的架構設計邏輯是不依賴任何特定硬體。這是我們和很多存儲産品最重要的差別之一。有些存儲産品宣傳的性能也很強,其實它是有前提條件的,比如使用了傲騰持久化記憶體來存儲中繼資料,如果缺少這一類特定的硬體,他的性能就會大打折扣,甚至是運作不了。

我們把類似傲騰這種硬體歸為非标品,因為他目前還是比較特殊、價格昂貴、未得到廣泛采用的新硬體。在我們的SDS軟體體系裡,沒有對非标品硬體的特定依賴,對于已經在市場上得到大量應用的通用硬體又提供了廣泛的相容性支援,客戶可以選擇不同類型的CPU架構,包括Intel,海光,鲲鵬,飛騰等,可以選擇不同品牌,不同類型的硬碟媒體,包括機械硬碟,SATA SSD, NVMe SSD,SCM SSD等,實作了從低端硬體到最高端的硬體的全覆寫支援。

同時我們架構設計的另外一個原則是要壓榨出硬體實體性能的極限,硬體能跑多快,我們的SDS軟體就能跑多快,對外提供相對應的存儲IO讀寫性能和帶寬,并且保證穩定的低延遲時間。在我們跟英特爾做一次聯合測試中,特地選擇了基于PCIe 4.0接口的英特爾傲騰P5800X,這是市場上性能最高的商用SSD之一,單盤就能跑出150萬IOPS。測試結果表明,我們的SDS2.0軟體WDS, 使用單個程序就可以将一整塊英特爾傲騰P5800X的峰值能力發揮出來,也就是達到近150萬 IOPS。整套分布式存儲系統對外能提供的峰值叢集性能與系統中的硬碟媒體的實體極限性能的總和基本相當,證明軟體側沒有瓶頸,能驅動最高端硬體的極限性能,轉化為客戶業務能夠使用的IO讀寫能力。

還有一類硬體叫DPU,對此我們的架構設計原則是不依賴于任何特定DPU,但是又預留開放架構與DPU硬體做協同,讓DPU起到錦上添花,提供更多附加價值的作用。

還有一類硬體叫是計算型存儲,就是SSD媒體内部擁有一定的計算處理能力,能夠在SSD媒體内部提供壓縮,解壓縮能力。我們也是在SDS軟體裡面預留開放架構與這一類計算型存儲媒體做協同,這樣可以在某些業務場景,給企業客戶提供更有價值的方案。

36氪:徐總,假設現在有兩家公司,他們能做出同樣的事情,但一家性能更出色,另一家穩定性更出色,穩定性更好的公司性能可以達到60分,另一家公司在某些點上的性能能做到90分,你們會選擇投哪家公司呢?

明勢資本徐之浩:我認為對于存儲産品來說,穩定性和可靠性都非常重要。往往對于一些新興的增量的場景,首先性能要滿足業務要求,如果性能滿足不了要求,再穩定也無法使用。

我其實有這個答案,之前遇到過類似的情況,客戶是願意為了滿足業務場景的性能需求、在中短期忍受穩定性的欠缺。在性能能夠滿足業務要求的前提下,穩定性和可靠性就會成為關鍵考慮因素了。我們會參考客戶訪談,團隊是否有做過同類商用産品的經驗,團隊的軟體工程能力和可靠性工程能力等來評估一家公司是否有能力研發出能夠穩定上生産,并且可以大規模複制銷售的存儲産品。

36氪:行業裡其實也有一些所謂在做軟體定義存儲或SDS這樣的公司,比你會覺得他們和華瑞之間現在聊的華瑞有什麼差別?從投資的角度來說,你認為什麼樣的公司未來的商業價值更高?

明勢資本徐之浩:團隊在願景上,在技術能力上,在選擇的技術路線上,有沒有成為行業的變革者和颠覆者的可能性,是我最看重的。可以比較明确地看到一個點是,大家可以去判斷一家存儲創業公司的産品是不是基于海外一些開源的存儲系統軟體在做,如果是的話,大機率做的就是SDS 1.0時代的産品。我對比較流行的開源的存儲系統也都有所了解,這類開源存儲系統的技術架構都比較過時了,發展潛力也有限,是不具備挑戰市場上的成熟集中式存儲産品,變革資料存儲行業的潛力的。我在華瑞指數雲看到了我看重的東西,我覺得這是比較核心的差別。

另外一個核心的差別是,雖然目前我們看技術看軟體,但商業化能力是非常重要的。我們确實能看到一些具備很強技術創新能力,或者技術方向在未來會有較大市場空間的一些創業公司大部分都走不到後面。這往往是因為早期,純技術創始人在商業路徑上的思考很容易彎路。現在的資本市場不是特别好,即使是在資本市場很好的時候,給創業公司的容錯空間也不見得有那麼大。像華瑞公司的話,兩位創始人中,羽中負責技術多一點,另一位創始人亮總,在做業務方面有很豐富的經驗,不僅在國内有經驗,在海外也有常駐的經曆,負責一個區域的業務。我覺得這個點對我們來說是很重要的。

綜合這麼考慮,一方面我們還是希望在産品上做到創新的。現在大家都喜歡講國産替代,稍微有追求一點,我們更希望我們做的是國産更新。很多時候純粹的國産替代會面臨很多問題,大家的産品會同質化,隻能切入相對低端且低毛利的場景中。是以在産品技術上,我們希望有國産更新的可能性。另外團隊上帶來的差異也比較大,無論是技術、産品還是商業,這都是很強的一支團隊,我覺得這一點也是挺關鍵的。

我再補充一個小點,是我們當初在接觸時讓我感觸很深的一點。我們一直在投各類軟體項目,可以看到很多軟體的創業公司早期并沒有在測試穩定性和品質保證上投入特别多精力,他們想先把東西做出來,然後再慢慢考慮後面的事。但華瑞這個團隊,我們在早期的時候就發現,他們很早就投入了很多錢去建設自動化測試環境,進行各種故障注入和長期穩定性測試。華瑞有一個完全自用的機房,現在差不多有160台伺服器組成各類測試平台。這個投入是非常誇張的。說實話我覺得中大型網際網路公司裡能把測試環境維持到100多台的都非常少。他們本身就是華為出來的團隊,非常了解穩定性和可靠性對企業軟體的重要性,在特别早期的時候,就投入了很多的資源和精力去建構環境和自己的測試體系,這給我的印象非常深。我們也投了很多資料庫類的基礎軟體,穩定性确實是早期基礎軟體需要邁過的一道坎,華瑞在這方面的意識和實際的投入是非常足的。