天天看點

生于疼痛的阿裡雲

編者按:3月28日,被雲栖社群夥伴虎嗅-虎研所專訪的一篇文章刷屏。分享給更多社群的讀者。

擁有超過10萬員工的阿裡集團,其平台交易總金額已經占到了中國社會消費品零售總額的13%,創造就業超過4000萬。這個龐大的數字經濟體,今年即将迎來二十歲生日。

鮮為人知的是,這個數字經濟體之是以能夠順利走到今天,離不開其花了一半時光所打造的業務與技術底座——那朵伴随着成長陣痛而扶搖直上的阿裡雲,今年也已經十周歲。

2019年3月,虎嗅專訪了阿裡雲智能基礎産品事業部總經理蔣江偉(花名小邪)、資深技術專家鐘華(花名古謙)。不出意外,采訪内容印證了我們此前的猜測:如果要從磅礴繁雜的阿裡經濟體中,找出一條讀懂“昨天,今天,明天”的業務線索,阿裡雲恐怕是不二之選。

煙囪

“即便你僅僅通路一次淘寶的首頁,所涉及的技術和系統規模都是你完全無法想象的,是淘寶2000多名頂級的工程師們的心血結晶,其中甚至包括長江學者、國家科學技術最高獎得主等衆多牛人。”

——卡特《你剛才在淘寶上買了一件東西》

2008年初,淘寶的程式員撞到了牆上,心驚膽戰。

那時候,淘寶在技術層面上,是一個由200多個功能子產品組成的代碼壓縮包,體積大概有幾百兆位元組。其複雜程度已經“超出人類的認知負載”,沒有人能完全掌握内部邏輯和關聯。“改動商品相關代碼,發現交易出問題了,改了論壇上的代碼,結果旺旺出問題了”。

這還是“幾個月就翻倍”的業務快速發展期。淘寶在峰值時的資料庫連接配接數量已經超過5000個,資料庫伺服器的CPU占用率常常超過90%,且無法擴容。

實際上,早在4個月前的一次戰略會上,阿裡決策層已經看到問題所在。

那個會的召集人是馬雲。平時戰略會都在西湖,那次他說找個看海的地方,思路開闊一些。但是當時秘書對甯波不熟,訂錯了地方,結果一群高管在一個海在哪裡都看不到的屋子裡,“不接地氣”地吵了兩天兩夜。

在最後一天晚上深夜,大家曆經争吵終于畫出一張圖。圖上示意,資訊流、資金流和物流将形成統一的資料智能,基本勾勒了12年後阿裡現在的樣子。

流淌在各個業務中的資料要做到“大一統”,項目被命名為“登月計劃”。

生于疼痛的阿裡雲

但,月亮美好,卻太遙遠。眼下的現實是,淘寶底層技術基礎已經危如累卵,已經是出了名的“改這裡、錯那裡”。

要上線“淘寶旅行”和“淘寶彩票”。為了“不給主站添亂”,技術人員就另起爐竈重新做了這兩個系統。哪怕有很多重複功能,比如使用者、交易、查詢、評價等功能。

重複建設還隻是成本的問題。一個個獨立的業務就是一根根獨立的煙囪,都長在同一片地裡,但各冒各的煙。資料大一統,無從談起。

連業務屬性最一緻的兩個業務——淘寶和淘寶商城(天貓的前身)都像兩個獨立的國家。

他們有很多共同的使用者、共同的商家,但車不同軌、書不同文,載着資料的“火車”到了“國界線”,必須要通過複雜的架構手段,“找一個翻譯”或者“換一個火車頭”。

生于疼痛的阿裡雲

再加上,阿裡的地裡長了這麼多煙囪,無數的火車頭和翻譯,複雜得不成樣子。

建設煙囪本來就是多年來的企業IT模式:你起一個業務,底下給你弄一套系統;再起一個業務,我再給你弄一套系統。設計、生産、供應、物流、訂單、庫存、分銷、客服……每個功能再一套系統,企業就是一片煙囪田。

這是工業流水線被發明之後,管理界的金科玉律:理順、配置設定、不斷優化每個封閉的業務流程,通過每個工序和業務流程的效率提高,進而提升整個企業的效率。

然而,當數字化資訊取代實物,成為最重要的生産資料後,工業流水線在數字化時代的弱勢便被無限放大——内部各環節之間隻能是串聯的,且對外部完全封閉,恰似一根根煙囪。

“你會發現轉不動了,新業務不斷出現,所有人都找IT部門要資源,看起來你挺牛,但其實你拖慢了所有人的節奏。”

“網際網路這種速度,生死都是一瞬間。慢下來就挂了。”

雖然決策層看到問題所在,也遙遠地指了一下月亮。但就像人類真的登上月球要付出沉重的代價,阿裡的“登月”也談何容易。

補天

“中國電商行業能有今天,上百萬淘寶店主都應該感謝秦始皇書同文車同軌,感謝聯考國文考卷上的國語發音題。”

——馬平《為了我們雙11“剁手”,中國準備了2000年》

2007年底,有程式員想了個辦法:将每個煙囪都必備,且邏輯最獨立簡單的使用者資訊子產品拆了出來,将其獨立成為單個公共子產品。這一嘗試後效果還不錯,淘寶又将交易子產品也獨立了出來。

2008年10月,基于此前的成功嘗試,阿裡進行了一次被稱為“給高速飛行的飛機換發動機”的大手術。

這個名為“五彩石”(即女娲煉石補天用的石頭)的項目,其核心訴求就是要将淘寶與天貓在資料和業務層面完全打通。

當時的解法具有了後來中台的影子:

1、抽離出每個業務的共性功能,如交易、支付、會員等等,打包成“磚塊”,房子千奇百怪,但磚頭都是一樣的。做一個新業務就變得非常容易。

2、讓資料沉澱到統一的池子,為之後喂養資料智能奠定基礎。

“大多數産品,産業共性70%,行業共性20%,真正和同行不一樣的,恐怕隻有10%”,阿裡資深技術專家古謙在見過上百家各行業龍頭企業後,這樣總結到。

而這一塊補天之石的影響,遠不止于此。

2009年初,五彩石項目結束,這個一共動用了200多人的公司級大項目(此前阿裡超過10人的技術項目就不小了),最終為阿裡沉澱了一套中間件技術,這個詞後來在技術圈普及,成為“拆煙囪”的标準。

生于疼痛的阿裡雲

(阿裡雲飛天研發團隊合影)

同樣在2009年,王堅率領的飛天團隊,正式挂出了阿裡雲的牌子。

在甯波的戰略會上,決策層們打算為“登月計劃”找個負責人,後來找來了王堅。

王堅人稱“博士”,不過在很長的時間裡,博士都有一副類似“騙子”的面孔。

馬雲說給阿裡雲每年投10億,投個10年,做不出來再說。但阿裡内部論壇上讨伐的聲音一浪高過一浪,花錢又不出成績,這哪是一個商業公司該幹的事情。

其實,這恰好說明阿裡雲的确生于疼痛,生于業務壓力:

第一、“登月”要解決算力的問題,現成的IOE模式完全不适用;

第二、“五彩石”補天之後,要有與之比對的分布式底座。

2013年,飛天單一叢集能力達到5000台,成為全球第一家對外提供這一能力的公司,算力的底座宣告建成。

到2018年底,阿裡雲在中國市場佔有率已經超過2到8名總和。同時,阿裡宣布組織架構調整,阿裡雲更新為阿裡雲智能,将中台能力與雲全面結合。阿裡雲正式成為阿裡經濟體的技術底座,以及全集團的技術能力出口。

而阿裡雲智能總裁,恰是十年前“五彩石”項目的負責人,“行癫”張建鋒。

生于疼痛的阿裡雲

今年3月21日,張建鋒首次在公開場合闡述了更新之後的阿裡雲智能戰略。至此,開端于2007年甯波海邊的故事,閉環完美劃上。“登月”的另一條隐線浮出水面。

阿裡雲此前被外界感覺的,更多是算力與資源排程能力,以及自主知識産權研發。卻少有人知曉,阿裡雲的壯大與發展,伴随着集團的每次業務陣痛與瓶頸突破,更與中台戰略密不可分——

從五彩石到阿裡雲,這不是某種巧合,而是同一邏輯下的自然延展。可以說,中台戰略與阿裡雲,就是互為因果,互為充要條件,缺一不可,非你不可的關系。

這不止是一朵能計算的雲,更是一朵可以解決實際業務問題的雲。因為,阿裡雲生于疼痛。而阿裡集團的那次疼痛,又比絕大多數中國企業早了十年。

1000個BUG

“犯了足夠多的錯誤,你跌倒,你站起來。所有的錯誤都是進賬,都是很棒的收入。”

——馬雲演講

“沒被洪水倒灌過,你怎麼能證明這個城市的下水道架構是合理的呢?”

阿裡雲智能基礎産品事業部總經理小邪給我們講了這樣一個故事,2013年,阿裡模拟出遠超過雙11壓力的流量,這股洪水灌下去之後,淹出來1000多個BUG。

“像這種非常極端而極緻的BUG,沒有這麼大的流量,是沖不出來的。即便招無數聰明的腦袋,也沒辦法解決的。”

這也是阿裡不同于其他公司的地方,它具備網際網路的規模、金融級的準确性、企業級的複雜程度。

在很多年前,有一個網際網路圈流行的詞彙,叫“滑鼠加水泥”,其含義是傳統商業模式與網際網路的結合。這些能夠做面對面生意的“重資産網際網路企業”,就屬于“水泥公司”,和那些隻靠螢幕就能滿足使用者的“滑鼠公司”截然不同。

而阿裡早在十幾年前,就是中國第一代“水泥公司”。這是其業務性質決定的,和BAT另外兩家的“滑鼠業務”完全不同。

比如,搜尋是可以有一定模糊範圍的,搜不出來幾個連結也沒關系,但電商不行,哪件商品搜不出來,商家都會電話投訴的。不僅内容上不能有偏差,每次交易的數字都代表着真金白銀,差一分商家也是不幹的。

再比如,社交行為基本是可以預見的,很難出現巨大的起伏跌宕。而電商使用者就如同12306一樣,面臨巨大的彈性,算力放多了浪費,放少了崩潰……

而且,其它網際網路企業的業務基本是比較清晰的,多是圍繞着一個主流量核心再去設定支流業務。而阿裡則從一開始就像個傳統企業,要把一個産品或服務從生産設計、庫存運輸、分銷推廣再到客服分析全鍊路包含,其業務複雜度遠超過同體量網際網路企業。

高精準度、高複雜度以及難以預測的高并發,共同構成了阿裡的技術瓶頸。這也是當業界大佬認為雲計算“新瓶裝舊酒”時,馬雲堅稱“不做雲計算,阿裡會死”的原因。

同期的其它幾家知名電商企業,依然在采購IBM的架構,甚至從Oracle請來了CTO。随後,這些企業的技術端紛紛在現實磨難中各種崩盤,而且對這種崩潰的彌補,很難得到系統性的提升。

十年後的2018,騰訊、美團、京東等企業,或多或少都放出了中台戰略和TO B戰略的消息,而雲計算也逐漸成為了各家的當紅業務線。

當然,還有更多傳統企業,在近幾年的市場挑戰中,逐漸發現了自身原本資訊系統建設的滞後性,開始求教于阿裡技術團隊。

這些事實無不印證着那個判斷:阿裡并不是多聰明或多奇怪,隻是比其它企業提前很多年就遇到了挑戰。而現在,大部分企業也走到了那個挑戰的門口。

讓天下沒有難碰的運氣

“我們必須承認各種不确定性,利用資料和資訊消除它們,而不是采用過去那種來自頂層的設計方式去解決問題。”

——吳軍《矽谷之謎》

在采訪中,古謙向我們展示了一組術語:VUCA。

這組術語包含四個詞,即Volatility(易變性)、Uncertainty(不确定性)、Complexity(複雜性)、Ambiguity(模糊性)。可以充分概括這個商業時代的特征。

企業商業模式的轉型,已經從電氣時代的30年一個生命周期,到資訊化時代的10年,到網際網路時代的5年,直至今天DT時代的2~3年的生命周期。

不确定性成為時代主題。生死都是一瞬間,就是這麼VUCA。

商業本質從未改變:資訊不對稱牟利的産品或服務,加上時代機遇,也可以稱為運氣。而在這個不确定的VUCA時代,機遇變成一個變幻莫測的東西。告别工業時代的“看十年做十年”的戰略思維,快速試錯和資料智能才是VUCA時代的王道。

這也恰恰是阿裡中台能力的價值,阿裡的聚劃算業務隻需要7個人花一個半月就能開發出來,飛豬、釘釘、盒馬等商業新物種頻繁湧現。很多阿裡内部幾個人幾星期做的事情,放在外部企業中,至少要幾十人幹半年。哪怕方向錯了,從頭再來,成本也要低很多。

企業能做的第二件事,就是形成資料的統一,挖掘智能的“石油”。

比如波司登連續兩年利潤猛増。這其中一大原因,就是利用中台政策,實時監控全國3000多家門店的庫存和銷售情況,進而降低庫存壓力和物流成本,提升商品售罄率。

這一升一降間,對于一家銷售額數十億的企業而言,隻要物流成本降10%,利潤很可能就會多出一兩個億。

一些咨詢機構則看得更長遠。比如埃森哲、畢馬威、德勤紛紛來找阿裡雲合作,就是希望可以幫助企業數字化轉型,并通過資料智能支撐商業決策。

結語

二十年前,在湖畔花園那間漏水的民宅裡,這家企業的基因就決定了後來的故事。它的根須在中國經濟社會的根須之間。受難于此,也反哺于此。

早于社會十年,阿裡遇到巨大困境。也由此築起了巨大的壁壘,來自别人所未長的見識,和不能承受的痛苦。

變身阿裡雲智能之後,阿裡的苦,要去解決社會的苦,将自己十年來在企業營運和商業實踐中總結的方法論和技術架構,打包成産品和商品,賦能整個經濟社會。

二十年前,阿裡在報紙上發出半個版的招聘廣告,那句廣告詞如今已經成為它的企業文化,“If not now, When? If not me , Who?”(此時此刻,非我莫屬)。

疼痛本就是先行者的必然經曆。世界在質疑,而你走了過去。

阿裡本身也是用機器做決策最多的公司,從阿裡小貸,到手淘千人千面,如果沒有AI能力,幾百人肯定無法營運這個萬億規模平台。

前谷歌雲首席科學家李飛飛曾多次說過,雲是人工智能落地的最好平台。這也是40%的中國500強企業、近一半中國上市公司、80%中國科技類公司齊聚阿裡雲的重要原因。

文章來源于:

虎嗅APP

繼續閱讀