天天看點

遞四方 X Hologres:雙11實時物流訂單最佳實踐業務介紹業務挑戰遞四方實時數倉之路遞四方與實時數倉Hologres業務價值

随着雙11的開啟,物流業也迎來了年度大考。2021年雙11期間,遞四方作為物流倉儲服務方,布局倉庫和分揀點超40+個,50w+平米作業場地,單日訂單峰值達千萬級别,海量購物訂單由遞四方配送到家,消費者由尾款人秒變收貨人。

業務介紹

遞四方成立于2004年,創業在深圳,是國内最早的國際物流和全球倉儲服務物流供應鍊服務商,主要為從事跨境電商的客戶、平台以及普通使用者提供倉儲物流服務,以GPN(直發訂單)和GFN(海外倉儲)兩張網絡為客戶提供更好的全球跨境電商優質生态環境,緻力于幫助中國企業走向全球,目前在全球超過100+家分支機構,服務全球約100萬家跨境電商商戶與超過2億跨境電商終端使用者。

業務挑戰

為了應對雙11單日峰值達到千萬級别訂單的狀況,遞四方運用大資料合理優化資源,提前做好全球倉儲人力、物力、運力配置,保障倉儲各流程高效、有序進行。從今年10月中下旬開始,上海轉運中心和東莞轉運中心相繼啟動。截至目前,遞四方陸續在華東、華北、華南建立、擴建超級樞紐、攬收倉至40餘個,繼續加大在全國的布局;在國内擁有40個+分公司/分撥服務網點,全國50萬+平方米辦公/作業場地面積。

在業務方面,遞四方借助自主研發分揀系統和雲技術,快速進行條碼識别,按指令分揀,實作稱重分揀一體化全面覆寫,保證每一票貨物都可自動識别、精準分揀出庫。稱重及分揀,已從傳統人工模式更新為100%人工管控模式。此外,遞四方資訊科技的黑科技硬體——紅光在此次“雙11”首次亮相。在分揀效率不變的情況下,遞四方資訊科技用光幕等技術手段,對分揀機落格包裹進行核驗,将庫内錯分率降低至萬分之三,達到業界領先水準。尤其針對倉庫環節,不斷加大對庫内的自動化、數字化、智能化建設,結合大資料、AI算法、雲計算等手段進行系統的研發更新,引進高科技裝置來提升産能、保障時效。

随着雙11期間訂單量劇增、應用的複雜度提升,我們的業務系統也經受着嚴峻的挑戰,原來的實時數倉架構已經不能滿足業務目前的需求。在尋找新的解決方案時,我們對比了業界常用的大資料實時查詢資料庫,比如HBase、ClickHouse、Druid,但在千億級别資料多表連接配接查詢時都遇到了瓶頸,無法滿足業務實時性、服務穩定性的要求。

實時數倉在遞四方的應用場景應用主要有以下幾個方面:攬收、庫内操作、倉間調撥、清關交郵預警監控,這裡面包含着單票運轉操作的每一個步驟。這些場景都需要做到實時監控,并且實時做出決策來提高物流的的整體時效。尤其是在雙十一高峰期的情況下,如果人力或資源配置設定不足,很容易使某一環節堵塞,進而影響整體物流的時效。在技術的層面,我們有很多個業務系統,這些系統之間既有一緻性也有獨立性,一個複雜名額涉及到多個系統多張表,是以我們實時數倉對表連接配接查詢能力非常強,而且對資料的更新插入速度也有着很高的要求。

今年雙11,我們對支撐業務的實時數倉系統進行了更新,通過新一代基于flink+hologres的實時數倉系統,在物流訂單量相較于去年增加多倍的情況下,仍然能夠實時監控每一票訂單的物流情況、每一個倉庫的作業情況,并且實時數倉整體成本下降50%,真正做到了“多、快、好、省”。

下面我們将會具體介紹遞四方實時數倉的更新演進之路。

遞四方實時數倉之路

實時數倉1.0

在剛開始做第一版實時數倉的時候,時間視窗比較緊,我們要把有限的精力放到資料模組化以及業務開發中,是以在對比了資料庫的吞吐性以及處理能力後,我們選擇了ADB。ADB在數量大很大的情況下,查詢速度、插入速度都很快,而且支援DTS、OTTER等資料同步接入,同步性能很好。

遞四方 X Hologres:雙11實時物流訂單最佳實踐業務介紹業務挑戰遞四方實時數倉之路遞四方與實時數倉Hologres業務價值

資料源是阿裡雲的PolarDB、MySQL、RDS等資料庫,采用阿裡雲的DataWork資料同步,把增量資料實時同步到ADB中,然後在ADB中做資料實時的計算,資料的任務排程在DataWork中完成。

但是當時遇到了一個非常大的問題,就是ADB的并發有限,計算任務耗費了大量的資源。在各種大屏、實時報表拉取資料的時候,高并發的情況下,ADB的延遲很高,給我們實時服務穩定性帶來了非常大的挑戰。

實時數倉2.0

經曆了第一個版本的實時數倉後,我們總結了實時數倉的兩個重要特性,一是實時,二是服務的穩定性。

第一個版本的實時數倉不能很好地滿足穩定性,我們決定對新的實時數倉進行一個深入的研究和探索,在阿裡雲上看到了很多關于Hologres的應用,其性能表現極其出色,帶來了不錯的效果。在對比了業界不同的實時數倉架構後,我們最終選擇了Flink+Hologres組合作為實時數倉。

遞四方 X Hologres:雙11實時物流訂單最佳實踐業務介紹業務挑戰遞四方實時數倉之路遞四方與實時數倉Hologres業務價值

這裡一共有2條路徑:

  • 第一條路徑是:通過DTS把Binlog資料同步到DataHub,然後使用Flink從DataHub中消費資料,把計算結果存儲在Hologres中,這條路徑主要是用于計算一些通路頻率高且資料量大的資料,比如待攬收單量、入庫單量、待完成單量等。
  • 第二條路徑是:業務系統的Binlog資料通過DataWorks同步到Hologres中。Hologres中分了3層,ODS層用于存放原始資料,直接加載原始日志、資料,資料保持原貌不做處理。一般情況下,以增量的方式從業務系統導入到ODS層,資料模型和粒度都與業務系統保持一緻。DWD層資料明細層,對ODS層資料進行清洗。DWS為彙總層,主要存放寬表。這裡主要是考慮到粒度的不一樣,在Hologres中多表連接配接查詢能夠發揮其最大的作用。整個架構的任務排程依賴于DataWorks。

本次采用的批流一體即席計算查詢混合模式,既發揮了Flink流計算的能力,也充分利用了Hologres強大的連表查詢能力。網際網路普遍運用的HBase、ClickHouse、Druid等作為實時查詢資料庫,我們的業務複雜度是網際網路的若幹倍,這些實時資料庫并不能完全滿足我們的需求,架構互有優劣,但我們的架構是未來五六年内業務高速增長的最佳選擇

遞四方與實時數倉Hologres

為什麼選擇Hologres

那麼為什麼會選擇Hologres呢?通過調研發現它有幾個特點,比較适合實際情況。

  • 第一是Hologres的實時能力,滿足目前遞四方的實時數倉需求,支援百億級表與億級表之間的JOIN,秒級查詢響應,還支援實時寫入、批量資料導入,擁有超高導入性能,且并發能力極強。
  • 第二是Hologres 采用存儲計算分離架構,資料存儲在阿裡雲分布式檔案系統pangu中(類比開源HDFS),友善按需單獨擴充計算或者存儲。對快速行業來說,大促和日常所需要資源不一樣,能夠快速擴縮容,滿足業務的動态需求。同時Hologres支援異構資料源互動分析以及離線資料和實時資料的聯邦查詢,Hologres已經和MaxCompute無縫打通,能夠直接在Hologres中加速查詢MaxCompute離線表。
  • 第三是維護成本低、運作穩定,Hologres作為實時數倉存儲成本大約是ADB的1/3。資源靈活性高,可以像MaxCompute一樣靈活的升降配置,與阿裡雲大資料元件相容性高,能降低運維成本和提高研發效能,不會對技術架構帶來很大負擔。

Hologres應用場景

在面向分析OLAP系統裡面,Hologres承擔了實時和離線資料的查詢,由于Hologres既支援高并發寫入,又能夠滿足及時查詢,同時還能夠支援OLAP分析,在我們的不同粒度的表進行連接配接的時候,能夠充分發揮其優勢。下面列舉2個不同的場景對其做一個詳細的說明。

場景一:庫内操作場景

遞四方 X Hologres:雙11實時物流訂單最佳實踐業務介紹業務挑戰遞四方實時數倉之路遞四方與實時數倉Hologres業務價值

實時的資料從Binlog解析到ODS層,同時微批任務将分鐘級别(範圍可調)的統計資料計算到DWS寬表,同時跟離線的資料進行插入更新,就可以得到實時的全量資料表,排程采取DataWorks的排程,每5分鐘排程1次。

場景2:倉間調撥場景

對于一些資料量小的表,依賴于Hologres強大的Join能力,通過視圖來建構DWS中間層,如下圖所示:

遞四方 X Hologres:雙11實時物流訂單最佳實踐業務介紹業務挑戰遞四方實時數倉之路遞四方與實時數倉Hologres業務價值

DWD是對ODS層過濾的視圖,DWS層是DWD層聚合層的寬表,每次查詢DWS層的時候,就相當于所有表重新查詢了一次。這種查詢語句是非常複雜的,對于關系型資料庫來說,可能有性能瓶頸會非常緩慢。但是對于Hologres來說,毫秒級别查詢完成毫無壓力,做到了實時響應,并且節省了排程資源,同時也提升了查詢的靈活性。

Hologres目前的不足

在使用Hologres期間也發現的一些不滿足實際需求的地方:一是非空列不能建立索引,多個億級别表連接配接在沒有索引的情況下,查詢速度下降。二是Hologres相容Postgre生态,但支援的函數不多,在開發上與MaxCompute相比有一定的難度。

業務價值

整個雙11期間,遞四方通過更新實時數倉技術,基于Flink+Hologres搭建的實時數倉支撐了實時大屏的高頻重新整理通路,實時監控物流動态,促進了業務高效運作,讓消費者的快遞更快到家。整個架構更新給業務帶來的價值有以下幾個方面:

  • 穩定:基于Hologres持續高穩定的輸出,整體雙11期間不論是實時資料寫入、還是資料的讀取都表現出了極強的穩定性。整個雙11期間,真正做到了0故障率。
  • 實時:實時的攬收、庫内操作、中轉調撥等實時大屏,對我們的營運提供了非常強有力的實時資料支撐,整體時效比去年提高了不少,給使用者帶來良好的物流體驗,提高了公司的服務水準。
  • 雲原生:除了上面兩個核心價值之外,由于雙11期間是流量高峰期,比日常流量高出上千倍,通過Hologres可以實作動态擴縮容,滿足我們對資源的不同需求,進而也降低了運維成本

這是遞四方參與的第7個雙11狂歡節,遞四方在這次的物流大考中交出了滿意的答卷。随着業務迅猛增長,遞四方也在不斷演進背後的實時數倉技術來支撐更豐富的倉儲物流場景,讓物流從“手工化”逐漸轉變為“智能化”

作者:

胡少鵬 副總裁助理 主要負責遞四方市場營銷以及品牌推廣

劉良苗 遞四方資深資料架構師 主要負責遞四方架構以及資料模型開發維護

遞四方 X Hologres:雙11實時物流訂單最佳實踐業務介紹業務挑戰遞四方實時數倉之路遞四方與實時數倉Hologres業務價值