天天看點

6000字解讀 | 東數西算三問,什麼場景、挑戰在哪、機遇如何?

6000字解讀 | 東數西算三問,什麼場景、挑戰在哪、機遇如何?

東數西算

2022.2.17​

一石激起千層浪,2022年2月17日,國家發改委、中央網信辦、工業和資訊化部、國家能源局聯合印發通知,同意啟動建設國家8個算力樞紐節點,正式布局完成“東數西算”總體設計。這8個算力樞紐節點包括京津冀、長三角、粵港澳大灣區、成渝、内蒙古、貴州、甘肅、甯夏。消息一出瞬時起各大相關廠商均發表相關看法,早就進行了布局,也有很多解析此政策的資料湧現出來。

6000字解讀 | 東數西算三問,什麼場景、挑戰在哪、機遇如何?

        通過解析東數西算戰略,我們不希望“東數西算”僅僅是一時熱點,而如何成為一項長期的政策。多思考一步不禁發問:

東數西算适合适合哪些場景?

在實施過程中會遇到哪些挑戰?

對于不同企業又會有哪些機遇?

1. 背景和現狀

        首先東數西算的背景現狀是東部、西部算力需求不均衡。東部在市場、技術、人才等方面有更多優勢,西部在資源、電力、自然條件等方面有更多優勢,兩者進行結合。算力需求和市場在東部、西部不均衡,資源等自然條件上東部、西部也不均衡,東數西算能夠在一定程度上東部捉襟見肘的資源困境和成本壓力,也能夠将“西部計算的結果賦能給包括東部在内的全國使用者”,此時西部提供的是智能化決策資料。

        早在2018年信通院和開放資料中心委員會聯合釋出的《資料中心白皮書》就揭示了北京、上海、廣東三個資料中心聚集區的機架數在逐年降低,但是全國對算力的需求在持續增長、伺服器使用量在持續增長,已經說明了使用需求逐漸轉向北上廣之外的資料中心。

        資料中心需要消耗大量電力來為了給伺服器冷卻降溫,并且整個資料中心的運作也需要消耗大量電力,電力是資料中心的核心成本之一,如何降低電力消耗和成本是資料中心面臨的主要挑戰。其實早在幾年前雲廠商、IDC企業已經從西部地區尋求突破建設了資料中心。比如在甯夏中衛有AWS等雲資料中心,在貴州有騰訊在山洞中建設資料中心,僅僅在内蒙古烏蘭察布有UCloud優刻得、快手、蘋果、阿裡等廠商建設資料中心。

6000字解讀 | 東數西算三問,什麼場景、挑戰在哪、機遇如何?
2. 場景

        東數西算,背景是東部、中部、西部計算需求和計算能力不均衡,東部計算需求量大,較多的資料中心也建設在東部地區,而東部的資料中心建設成本、營運成本高居不下,這些成本最後都會分攤到使用者頭上,将東部資料轉移到西部地區進行計算是需求來驅動的。政策雖出,但并非一股腦抛棄東部資料中心而冒進轉向西部地區。

2.1  部分行業、部分資料

        還有一部分就是離線分析的資料,企業中有非常多需要離線分析的資料,可轉移到西部進行計算。這裡主要是利用西部資料中心算力便宜的優勢。離線資料,比如軟體系統中的日志分析、每日每月報表分析、使用者千人千面算法分析、背景加工、視訊渲染、超算等計算能力密集度要求高的場景。

        這中間增加了資料傳輸的過程,可計算價格便宜的優勢足以抵過資料傳輸帶來的成本。

東部樞紐處理工業網際網路、金融證券、災害預警、遠端醫療、視訊通話、人工智能推理等對網絡延遲有高要求的業務。

2.2  場景-AI訓練、視訊渲染、超算場景

6000字解讀 | 東數西算三問,什麼場景、挑戰在哪、機遇如何?

        以UCloud優刻得為例,AI平台提供訓練、線上推理等服務,使用者可選擇在西部雲資料中心中運作算力密集度高的AI模型訓練任務,将原始資料上傳至西部雲資料中心對象存儲平台并通過AI訓練平台排程底層CPU、GPU資源完成模型訓練,訓練出的模型再同步至東部雲資料中心的鏡像Hub中并用于推理服務。

        視訊渲染也是算力密集型任務,将需要渲染的資料存儲至西部雲資料中心,充分利用計算資源充足和價格優勢完成視訊渲染,将最終視訊推流至使用者端。使用者會分布在全國各地并且在東部地區集中,這時以西部雲資料中心為中心雲節點,東部地區采用邊緣計算節點來緩存加速視訊檔案和相關資料,實作就近通路。

        同樣對于科研計算中的流體力學、實體化學、生物資訊等高性能超算場景,也同樣适合在西部地區雲資料中心中進行計算。

2.3  場景-托管

        在企業上雲過程中不僅僅是把所有業務和資料“All in”全部遷移至雲平台,因為企業IT曆史原因會有實體伺服器叢集等狀況,可選擇在企業本地實體伺服器叢集和公有雲之間建構混合架構,也可以選擇将實體伺服器叢集托管至雲平台。選擇東部雲資料中心,還是會有資源容量、價格等因素的影響,随着西部資料中心的建設和配套服務的完善,需要有伺服器托管的使用者有了更多選擇。之前中西部地區使用者将實體伺服器跨城托管至東部雲資料中心的确不便捷,現在中西部地區使用者可就近選擇雲資料中心進行托管。

        金融等行業根據合規要求需要采用與其他使用者實體隔離的機櫃,甚至需要對這些機櫃實體上鎖鎖住,在西部雲資料中心中将會有更大空間和自由度來為這類托管需求的使用者提供資源支撐和運維服務。

2.4  資料歸檔

        是否還記得2020年7月GitHub把代碼封存到北極,将儲存1000年,可以說是将資料進行了一次長期的歸檔存儲。直播帶貨視訊根據合規要求要至少儲存三年,醫院醫療影像、醫療診斷記錄也要根據合規要求進行長時間儲存,存儲這些資料一方面是對容量的挑戰,另外一方面就是價格的挑戰。這些就是我們說的冷資料、歸檔資料,存儲時間長、存儲容量需求急速增加是亟需解決的問題,而東部資料中心存在天然價格高的短闆,是以将冷資料存儲至西部資料中心是非常好的選擇了。

2.5  中西部省市建設政務雲、當地上雲選擇

        前面已經介紹了,在東部地區資料中心比較集中,不同省市建設政務雲以及企業上雲時會選擇位于東部地區的資料中心,因為東部資料中心配套的網絡建設、運維服務、方案成熟度相對更高,但這樣也讓東部資料中心可擴充的資源空間捉襟見肘、提升了整體業務所需的成本,雲廠商、IDC廠商等都在西部地區尋找替代方案。在西部集中建設資料中心,能夠讓企業更關注在每個資料中心的網絡品質、運維服務能力等。中西部地區的企業、組織、政府機構就能夠将之前在東部的業務和資料遷移至西部地區,對于内蒙古當地企業就近選擇烏蘭察布等地資料中心即可,對于貴州當地企業選擇本地區的資料中心,能夠拉動本地資料中心以及配套服務的發展、也能充分利用當地電費便宜帶來的整體業務耗費成本降低的利好之處。

個人觀點

        在整個政策上,需要将位于東部資料中心的部分可離線計算的資料一步步轉移至西部,另外就是部分行業場景新産生的資料直接存儲至西部資料中心,我的了解這也都是東數西算的範疇。​

3. 挑戰

3.1  需求至上

        避免資源浪費,節能減排是長期政策,2022年1月17日釋出的冬奧會踐行碳中和方案已經公布,西部資料中心建設本身就因為會采用清潔能源、更多的依靠自然條件進行降溫,同時近些年發展積累的低碳環保資料中心建設經驗積累都将會在西部地區一展抱負。是以可以相信底層資料中心的建設和營運是符合碳中和發展理念的。

但在業務和資料遷移時我們還要保持頭腦清晰、避免盲目跟風,需要根據需求來建設資料中心、遷移業務和資料。

        将計算任務和資料彙聚在集中的資料中心進行計算,達到較高的資料中心上架率和伺服器運作率就是資料中心營運者需要關注的核心點了。在東數西算工程中、在踐行碳中和理念中,絕不能僅僅依靠西部的自然環境,人為營運決策也要在提升資源使用率中多思考。

3.2  技術底座挑戰-更通暢的網絡

        無論是資料傳輸到西部地區進行計算,還是傳輸到西部地區進行存儲,對資料傳輸能力都是極大的挑戰。是以在東數西算的整個布局中除了西部的資料中心建設,必不可少的就是建設資料中心之間的高速網絡通道。

        從單個雲資料中心部署業務的模式,也會逐漸向中心雲+邊緣雲、分布式的混合架構部署模式進行轉變,也會成為技術挑戰,比如分布式協同的要求高、資料實時一緻性要求等。不過在部署業務上雲原生能夠幫助業務基于不同資源的無差别部署。

3.3  更近的接入點,“中心雲+邊緣雲”

        之前的模式是東部作為源站,中西部作為CDN節點、邊緣計算節點,現在可以反其道而行之。将西部作為中心雲進行資料計算,将全國各地的邊緣計算節點串聯起來,也能夠将使用者本地的伺服器叢集統一納管起來,形成統一的混合架構。​​

6000字解讀 | 東數西算三問,什麼場景、挑戰在哪、機遇如何?

        在這個過程中,搭建混合架構是融合架構的過程,對于企業使用者來說既使用東部的資料中心、也會使用西部的資料中心,對于還有自行營運的機房或伺服器叢集也将會通過網絡連通至東部、西部資料中心。整體是混合架構的模式。

        核心部分是網絡的連通,包括專線、SD-WAN、VPN的方式,當然可以寄希望于國家整體的網絡建設,國家主導聯合企業建設網絡大通道,多租戶的方式也會降低邊際使用成本。另外,通過混合架構,能夠充分利用混合架構的優勢,擴充本地計算能力不足、存儲備份能力不足、安全防護能力不足、産品不夠豐富等短闆,都可以通過雲平台進行補充。

        東西部資料中心、邊緣節點的混合架構,能夠讓使用者請求按照距離就近、按照通路品質較優線路選擇資料中心接入,再通過資料中心、邊緣節點之間互聯互通的線路通信和資料傳輸。

6000字解讀 | 東數西算三問,什麼場景、挑戰在哪、機遇如何?

3.4  更安全

        東數西算顯然會讓資料實作東西部資料中心之間遷移或傳輸,那跨越千山萬水中間安全問題也成為其挑戰。不過在西部建設的資料中心在實體層面的安全問題并不用擔憂,資料中心在建設、驗收等過程中有嚴格的國标來把關,比如GB50462-2015《資料中心基礎設施施工及驗收規範》、GB50174-2017《電子資訊系統機房設計規範》。

6000字解讀 | 東數西算三問,什麼場景、挑戰在哪、機遇如何?

安全防護方案子產品概覽

        在資料傳輸過程中被竊取和篡改的風險、資料中心的伺服器是否會遭受各種病毒入侵,還有網絡層經常見到的DDoS攻擊、cc攻擊、SQL注入攻擊、XSS跨站攻擊等都讓業務和資料面臨業務中斷、資料損壞的窘境,緊接着導緻各種經濟損失和企業名譽受損。是以在資料中心建設的實體層安全之上,還要多加關注應用和資料在主機層、網絡層、應用層等各層會遇到的安全風險并針對每種風險準備安全措施。

        除了安全,還有業務和資料的合規、審計等需求。需要審計的資料正好大部分是離線資料,适合放在西部進行存儲和離線分析。

6000字解讀 | 東數西算三問,什麼場景、挑戰在哪、機遇如何?

雲端安全知識雲圖,微信聯系擷取高清原圖

3.5  更有的綜合服務能力

        不僅僅是硬體資料中心,還有上面的軟體服務,也就是雲計算、技術服務、雲資料中心運維、根據客戶需求進行方案設計的軟實力,以及幫助使用者優化架構提升效率、降低使用成本等最佳實踐的應用,需要更高效的綜合服務能力。

        在雲端實作業務數字化轉型、提升效率需要經過良好設計的架構方案,我的新書《雲端架構》提煉了架構設計中要遵循的6大架構設計原則,也有架構設計中的41種設計模式,可作為模闆來組合成為解決方案,對解決方案架構的适用性、成熟度、健壯度提出了評估模型。《雲端架構》内容貫穿架構設計的建構、重構、評估整個流程,相信能夠幫助相關人員快速掌握雲計算各項服務、架構方案并實作業務合理上雲。

​​

6000字解讀 | 東數西算三問,什麼場景、挑戰在哪、機遇如何?

​​

圖: 源自《雲端架構》,購買或咨詢請微信聯系​

4. 機遇

4.1  雲廠商

        部分雲廠商已經提前幾年布局西部地區建設雲資料中心,比如前面提到的UCloud優刻得、阿裡雲、華為雲、騰訊雲、AWS等。東數西算的國家戰略工程釋放的不僅僅是在西部進行資料存儲和計算,帶來更多的是政務、傳統企業、制造企業等企業的上雲,之前對雲懷遲疑态度的企業、機構會再次審視上雲的可行性,并且能夠在上雲的過程中實作成本節約、加快實作數字化轉型、提升營運效率等上雲帶來的好處。

        雲廠商在東部地區,尤其是北京、上海、杭州、廣州等地雲資料中心營運業務積累的雄厚的技術經驗,以及支撐超大規模電商平台促銷活動、高并發大型遊戲等網際網路場景支撐經驗,還有在金融、教育、醫療、交通等各行業需求場景經驗和最佳實踐,這都為全行業、全場景上雲提供可參考的範本。

        雲廠商在最近幾年中競争愈演愈烈,不僅中小雲廠商,包括雲計算頭部的企業也都面臨着新的行業突破、新的客戶填補增長空白等新的挑戰,而東數西算戰略布局能夠促使企業、政府更願意上雲,也能夠為雲廠商帶來業務戰略方向的轉移、降低現有白熱化競争帶來的焦慮。

        雲廠商之間有競争,合作模式也并不容易尋找,但是站在使用者角度上,其實需要更多考慮并采用多雲政策。單個雲平台在資料中心布局、産品豐富度、計價模式、服務效率等方面各有差異,使用者采用多雲政策可以分擔在這些因素中的風險,并且還可以減少單個雲廠商技術鎖定、商業綁定帶來的風險。

4.2  IDC廠商

        IDC企業在西部地區的資料中心基建過程中有非常多機遇,2017年前後不少雲廠商、IDC廠商已經選擇了西部地區建設資料中心作為戰略方向突破。經過這幾年驗證和國家東數西算布局,這還僅僅是一個新的起點。

        在建設符合标準的資料中心之上,IDC企業也不是沒有積極探索更好的商業模式,比如自行營運雲平台,能夠面向To B使用者推出基礎資料中心和增值服務并獲得一些關系穩定的使用者,但在這個方向上并沒有和雲廠商競争的太多優勢。但在建設和運維營運資料中心上,雲廠商反倒要多借鑒IDC企業豐富的建設、營運經驗,比如萬國資料在2021年4月推出了資料中心智能駕駛倉成熟度分級評估模型,來評估資料中心建設運維成熟度。

        在東數西算過程中,IDC企業能夠關注政府統一安全的資料中心基建,也能承擔部分自建自用的資料中心,也能在西部省市政務雲和當地企業上雲過程中提供資料中心資源支援,也就是避開雲廠商直接向這些使用者做生意。在2022年之後,雲廠商競争已經加劇到白熱化階段,即便東數西算帶來很多利好,雲廠商也都會選擇在西部自建資料中心而非找IDC廠商代為建設。  IDC建設企業會有很大利好,售賣給直接企業使用者或者雲廠商。雖然有競争,但IDC廠商和雲廠商的合作關系優于競争關系。

6000字解讀 | 東數西算三問,什麼場景、挑戰在哪、機遇如何?

4.3 安全中心、災備中心

        除了雲廠商和IDC廠商,在技術方面層面,也有很多機遇。比如可考慮在西部地區建設政務雲、交通銀行等垂直行業統一的災備中心。比如在西部地區整合資源建設統一的安全防護中心,比如DDoS流量清洗中心。在東部資料中心上部署的業務遭受DDoS攻擊時将所有流量牽引至西部的統一DDoS流量清洗中心,将清洗後的正常使用者請求再轉發至東部資料中心并提供正常服務。

4.4  隐私計算

        東數西算将資料彙聚在西部多個算力樞紐,也為資料隐私計算和交叉計算提供了“實體距離近”的優勢。資料隐私計算就是在保護資料本身不對外洩露的情況下實作資料交叉分析計算的技術。建設智慧城市需要大量授權資料進行交叉分析,比如城市建設基礎資料、交通資料、學校資料、商圈人流量資料、市民消費水準資料、店鋪分布資料等,資料分布在不同的大資料中心,為了統一的上層智慧城市建設,需要将不同部門、不同領域的資料融合起來進行分析,當然是在有授權、合規使用的前提下。值得一提的是,UCloud優刻得提供有安全可靠的隐私計算平台--資料安全屋。是以對于資料隐私計算、算法提供、基于資料的二次開發應用也是機遇之一。

4.5  人才

        在西部進行資料中心、網絡的基建,以及提供資料中心運維服務、面向業務的傳遞和技術支援,還需要專業的技術人才。資料需要東數西算,經驗可從東部進行借鑒,人才可從中西部當地進行發展和培養,為當地帶來更多人才和就業。

5. 挑戰與機遇并存,時刻準備着

        東數西算工程,能夠進一步促使産業向數字化進行轉變、能夠為業務降本增效、能夠使用新的技術和思路解決之前棘手的業務問題。在這個長期的過程中會有更多的挑戰,同時也并存有機遇,機遇留給每一個有準備的人,我們拭目以待。

        我個人在前面十多年工作中總結了基于雲平台進行架構設計的經驗,準備了兩年完成《雲端架構》新書的寫作,現已上架京東、當當、淘寶,關注并聯系我們,等待下周的首發儀式。

        與你一起,做有準備的人。