天天看點

揭開618與英特爾資料中心GPU背後的故事

作者:51CTO

來源:科技正能量

又是一年618。

每到電商銷售旺季,都會迎來雪片一樣的訂單,這既考驗電商平台承擔的速度和效率,更是對物流公司的分揀和運送能力的檢驗。網際網路讓使用者變得更為挑剔,使用者很難接受狂歡之後的等待,優質的物流則是保證使用者體驗的第一環。

揭開618與英特爾資料中心GPU背後的故事

今年618期間,上海區域200多家韻達網點全部開啟了“預售極速達”服務,旨在将預售訂單第一時間送至客戶手中。在這項服務的背後,是AI、大資料和IT系統結合的力量。

1)AI讓分揀壓力化為無形

物流行業,通常有倉儲和分揀兩個關鍵環節,而在物流系統中,分揀是最為繁瑣,用時最長的環節。

揭開618與英特爾資料中心GPU背後的故事

使用者在電商平台上下單,由系統分揀子產品,将貨物根據訂單位址進行區分,配置設定至不同地點的倉庫。訂單抵達倉庫之後,即開始分揀。接着出庫抵達下一級分撥中心或者中轉站,最後進入配送。

在電商銷售旺季,處于流程前端的下單量會短時間内激增,唯有提高分揀流程的效率,才能提升整個物流系統的效率,為使用者提供優質的服務。一些優秀的物流公司,正在求助于AI,在分揀流程的幾個關鍵環節以智能化的手段,獲得更高的分揀效率。

為了應對電商購物節期間的業務量洪峰。韻達在分揀中心實施了網格倉政策,借助由視覺人工智能 (AI) 驅動的智能共配分揀系統對快件進行自動分揀。

通常的智能分揀中心,現場的人力并不多,核心業務流程都依靠系統控制,流水線的運作速度也飛快,會有一種看到水在流動的視覺感受,就像是力與美的結合。

在這種“美感”的反面,則是分揀線面臨的準确度與低延遲時間的壓力。分揀線會對快件面單上的資訊進行三段碼 OCR (Optical Character Recognition) 檢測,由于識别的結果決定着快件在分揀線上的去向,是以該步驟對分揀效率至關重要,對系統的識别準确度和時延有較高要求。

一旦識别出現錯誤,就會造成分揀線回流,即快件需重新再過分揀線或需要人工分揀;而當錯誤率較高時,更會加重網點的操作壓力。故而,韻達提出系統識别的準确度須達到 95% 以上。另一方面,系統時延與分揀線傳輸速度息息相關,檢測算法的時延會直接影響分揀傳輸的效率,過慢就會造成快件積壓,進而影響分揀速度和派送時效,韻達經過評估後發現智能分揀線系統的時延必須要小于130ms才能滿足他們對高效率的需求。

為了解決這些難題,韻達選擇了英特爾的解決方案,基于英特爾® 資料中心GPU Flex系列 170和英特爾® 分發版OpenVINO™ 工具套件來優化其三段碼OCR檢測系統和分撥視訊分析平台性能。

為驗證方案性能,韻達進行了三段碼 OCR 測試和TSM (Temporal Shift Module) 測試。在三段碼OCR測試中,共對2450張圖檔進行了識别,測試結果顯示平均運作時間為 114ms,很好地滿足了韻達對低延遲時間的需求;準确度能夠達到 97%-98%,也優于韻達 95%的預期基準。

在TSM測試中,選用了1200個視訊并分不同執行個體和批量大小做了測試,測試結果如圖所示。

揭開618與英特爾資料中心GPU背後的故事

綜合測試和網店測試結果,韻達的視覺AI方案從算力、時延、準确度、并發能力、穩定性和散熱能力等多個方面都能很好地滿足韻達的需求,并帶來了如下企業優勢:

第一,提升業務效率并降低成本:智能分揀系統的部署顯著提升了分揀線效率,進而提升了派送效率和派送時效;此外,高效的智能分揀系統還幫助韻達實作了人力和成本節約。

第二,優化業務管理和決策:英特爾® 資料中心GPU Flex系列170帶來的高算力讓韻達實作了更高效的分撥視訊流分析,可幫助韻達在跨年度/跨季度預測、合理定價、網點時效提升和獎懲制定等方面做出優化。

2)每個物流場景,都少不了英特爾的身影

實際上,這僅僅隻是韻達基于英特爾GPU的解決方案,其實韻達與英特爾和合作遠不止于此。

早在2018年,韻達就與英特爾展了全方位的技術交流與協作,英特爾的至強®️ 可擴充處理器及其他一系列軟硬體産品技術在“大小件測量”、“資料中心異常檢測”以及“件量預測”等多個關鍵環節上為韻達建構起高效的AI應用底座。

揭開618與英特爾資料中心GPU背後的故事

在2020年,為了利用AI視覺技術解決在物流運輸、分揀、派送等過程中遇到的難題,韻達也采用了英特爾CPU及其他軟硬體組合,完成了智慧視覺解決方案的優化,實作了分轉中心智能資料處理,但也同時遭遇了新的技術挑戰:

一方面,由于物流場景的複雜性與多變性,物流行業有着爆倉識别、違規操作分析、車輛到站識别、裝載率識别等非常複雜的場景,一個場景甚至會出現幾十種不同的情況,未經優化 的算法可能會出現效率與精度問題,影響設計目标的實作。

另一方面,因為視訊推理等人工智能負載對于硬體有着嚴苛的需求,傳統的硬體在邊緣側難以滿足視訊推理在性能、精度、功耗等方面的需求,同時,專用的硬體方案也有成本昂貴、開發與部署門檻高等問題。

當然,從深度學習算法自身來看,面向圖像識别的深度學習模型也常會存在解釋性差的問題,模型複雜度高、優化困難,計算強度高、對于算力有着較高要求,需要進一步實作算法優化。

在此項目中,英特爾和韻達一起建構了基于至強® 可擴充處理器和酷睿™ 處理器的邊緣計算解決方案,将工作負載轉移到網絡邊緣,不僅降低了網絡負載與人工智能推理延遲,還切實降低了人工智能基礎設施平台的采購成本,以及高帶寬網絡的部署與運維成本。

值得一提的是,除了硬體之外,韻達還通過英特爾® SVET開源套件快速搭建了視訊拉流、解碼、抓圖編碼分發業務,同時利用OpenVINO™️ 工具套件,在英特爾平台上優化了視覺算法,提升了性能。

不止韻達,也有其他物流公司選擇了英特爾基于異構的基礎設施,利用XPU實作AI推理加速,同時借英特爾® 分發版 OpenVINO™ 工具套件和英特爾® oneAPI工具套件等簡化開發與運維,實作應用跨 XPU 的無縫切換。有效監測園區内是否存在攀爬傳送帶等危險作業,踩踏、暴力分揀等違規作業,以及未戴安全帽等着裝安全問題。

英特爾還将以更多、更高性能的專用加速器,持續為物流行業及合作夥伴帶來更多場景的優化方案。

3)AI驅動,讓每個包裹都能準時送達

通過以上案例,我們也發現不同物流場景中都面臨着相似的難題:比如模型開發與維護難度大,計算強度高,再比如專用的硬體方案也有着成本昂貴、開發與部署門檻高等問題。

走向AI驅動的智慧物流,要跨越這些難題,英特爾顯然已經給出了自己的答案:

那就是更加全面、異構化的産品布局,用更加完備的軟硬體産品組合為全開發鍊路護航。

  • 通用計算晶片:如至強®️ 可擴充處理器,其部署門檻最低,可以充分利用企業現有的IT基礎設施;

通用加速晶片:英特爾®️ 資料中心GPU Flex系列主攻視覺類的AI推理加速,而資料中心GPU Max系列包含有超過1000億半導體,可為AI模型的高效訓練提供強有力的支援,同時其還能兼顧科學計算,加速多個架構中的SC和AI工作負載;

  • 專用加速器:Habana®️ Gaudi2®️ 的釋出也已近在眼前,據悉7月它就會正式與使用者們見面,并且在6月27日剛剛釋出的MLPerf新一代測試報中,它已經有了先聲奪人的表現——不論是大家非常熟悉的BERT、ResNet、Unet模型,還是最近半年異軍突起的大語言模型GPT-3,Gaudi2️® 都有非常靓眼的表現。

當然,跨異構XPU的切換,少不了軟體的支援。借助OpenVINO™️ 工具套件和oneAPI工具套件等可以幫助使用者簡化AI應用開發并實作跨XPU的無縫切換。使用者可以根據自身工作負載的需求,選擇更适合的晶片的運作。

4)小結

物流業是支撐經濟社會發展的基礎性産業。在數字經濟時代,物流不僅是單行道,還促進了新的零售業和新的制造,提高了傳統的庫存周轉率,建構了靈活的供應鍊。

揭開618與英特爾資料中心GPU背後的故事

随着物流業的規模不斷擴大,傳統物流的營運模式受到挑戰,急需向智能化轉型更新。以數字化技術,尤其是AI技術的賦能,物流行業走向智慧化,精細化,高效化是大勢所趨。

但AI應用的開發和優化并非易事,尤其是在異構計算興起的今天更是變得越來越複雜。英特爾擁有強大且專業的技術團隊,完備的異構硬體産品布局,易用的軟體工具組合,可以為物流乃至更多行業AI應用的開發、部署、落地應用提供支援。

讓AI驅動物流行業智能化轉型,讓每個包裹都能準時送達。

繼續閱讀