伏羲(Fuxi)是十年前最初創立飛天平台時的三大服務之一(分布式存儲 Pangu,分布式計算 MaxCompute,分布式排程 Fuxi),當時的設計初衷是為了解決大規模分布式資源的排程問題(本質上是多目标的最優比對問題)。
随阿裡經濟體和阿裡雲豐富的業務需求(尤其是雙十一)和磨練,伏羲的内涵不斷擴大,從單一的資源排程器(對标開源系統的YARN)擴充成大資料的核心排程服務,覆寫資料排程(Data Placement)、資源排程(Resouce Management)、計算排程(Application Manager)、和本地微(自治)排程等多個領域,并在每一個細分領域緻力于打造超越業界主流的差異化能力。
MaxCompute作為阿裡經濟體的大資料計算平台,每天運作着數以千萬計的作業,處理EB級别的資料,這些作業和資料分布在全球各個資料中心的不同叢集,當作業運作和輸入資料不在同一個叢集中時,稱之為跨叢集資料依賴。随着MaxCompute業務的高速發展,跨叢集依賴量也急速增長。複雜的業務依賴關系不可避免的會産生大量的跨資料中心的網絡傳輸,而跨資料中心的網絡具有帶寬小,延遲高,穩定性低的特點,并且價格還貴。如何平衡各叢集的計算和存儲使用率,降低帶寬成本,成為了亟待解決的一個難題。
這次我們不再給你萬字長文,而是請到了“愚公”系統的兩位主要技術負責人,以脫口秀方式,為大家介紹阿裡巴巴MaxCompute團隊對于多叢集資料和計算排程最優解決方案的探索和階段性成果。
技術人的脫口秀來啦~~~

想了解更多?
歡迎加入 MaxCompute開發者社群釘釘群,與更多阿裡巴巴大資料技術專家和大資料開發者共同交流