天天看點

從圖森未來的資料處理平台,看Serverless 工作流應用場景精準打造雲上自動生産線,Serverless工作流正式商用助力圖森未來,自動化資料處理平台, 讓一切簡單可靠Serverless工作流更多應用場景

Serverless工作流來了!

釋出會傳送門

搶先了解Serverless技術幹貨

4月,阿裡雲Serverless工作流正式商業化,這是一款用于協調多個分布式任務執行的全托管 Serverless 雲服務。産品緻力于簡化開發和運作業務流程所需要的任務協調、狀态管理以及錯誤處理等繁瑣工作,讓使用者聚焦業務邏輯開發。

精準打造雲上自動生産線,Serverless工作流正式商用

工作流是一種非常常見的場景,比如企業内部審批、采購訂單、ETL等日常企業事務,或者大資料處理流水線,正常或定制化自動化運維等。此外,音視訊行業的多媒體檔案分片轉碼、格式轉換、稽核校驗和人臉識别等長時任務,電商旅遊行業的客戶線上訂單,AI行業的機器學習流水線, 生信行業的基因測序工作流。

這些場景面臨着以下難點:一般由衆多異步分布式任務組成,控制邏輯和任務邏輯交織在一起,流程複雜冗長;分布式任務可能跨越公共雲和本地機房,安全的打通網絡代價很大;整個工作流執行完畢耗時過長,造成資源占用的浪費;涉及異步且關鍵業務流程,務必保證資料一緻性;繁複的執行步驟如何進行可視化監控等等。

Serverless工作流正式針對這些痛點,分離控制邏輯與任務邏輯,細化責任,便于管理和維護; 将流程以模版方式統一定義控制,簡化編排,通過串聯或并行等多種方式編排任務;支援函數,隊列,雲服務等多種任務類型,打通公共雲和企業内網;支援最長1年的執行任務,但卻采用Serverless計費模型, 按需付費;動态調用并發函數,保持狀态和消息的持久化,資訊不丢失且最終同步,提高容錯性,自動處理異常;流程進度可視化,曆史執行可追溯性等等。

從圖森未來的資料處理平台,看Serverless 工作流應用場景精準打造雲上自動生産線,Serverless工作流正式商用助力圖森未來,自動化資料處理平台, 讓一切簡單可靠Serverless工作流更多應用場景

助力圖森未來,自動化資料處理平台, 讓一切簡單可靠

圖森未來是一家專注于L4級别無人駕駛卡車技術研發與應用的人工智能企業,面向全球提供可大規模商業化營運的無人駕駛卡車技術,為全球物流運輸行業賦能。目前已完成D輪融資,估值超過10億美元。無人駕駛技術研發依賴大量的路測試驗資料積累,而高效進行路測、快速對路測資料進行處理來指導模型的更新疊代是這類場景的核心訴求。

路測過程中會有大量資料産生,而對這些資料的處理流程則複雜多變,即使對于同一批資料,不同的業務小組也會有不同的使用及處理方式。如何有效管理不同的資料處理流程、降低人為介入頻率能夠大幅的提高生産效率。

路測不定時運作的特點使得流程編排任務運作時間點、運作時長具有極大的不确定性,本地機房獨自建立流程管理系統難以最大優化機器使用率,造成資源浪費。而圖森未來本地已有許多單元化業務處理腳本及應用程式,但因為各種限制而無法全量的遷移上雲,這也對如何合理化使用雲上服務帶來了挑戰。

另外,由于處理流程的步驟繁多,不同任務間的資料共享變得十分重要。任務之間在互相依賴的情況下,非常考驗系統可靠性。是以,對于複雜流程的步驟間的狀态及資料管理也是業務所面臨的一項挑戰。

從圖森未來的資料處理平台,看Serverless 工作流應用場景精準打造雲上自動生産線,Serverless工作流正式商用助力圖森未來,自動化資料處理平台, 讓一切簡單可靠Serverless工作流更多應用場景

針對上述情況,圖森未來開始探索資料處理平台的自動化。阿裡雲 Serverless 工作流按執行排程的次數計費,具有易用易內建、運維簡單等諸多優點,能夠很好的解決上述場景中所遇到的問題,非常适合這類不定時運作的離線任務場景。Serverless 工作流還支援編排本地或自建機房的任務,圖森未來通過使用 Serverless 工作流原生支援的消息服務MNS解決了雲上雲下的資料打通問題,使得本地的原有任務得到很好的編排及管理。

除了排程外,Serverless 工作流也支援對任務的狀态及執行過程中所産生的資料進行維護。圖森未來通過使用任務的輸入輸出映射及狀态彙報機制,高效的管理了流程中各任務的生命周期及互相間的資料傳遞。

在未來,随着業務規模的擴大,圖森未來将持續優化離線大資料處理流程的運作效率及自動化水準。通過各種探索,圖森未來将進一步提升工程團隊的效率,将更多的精力和資金投入到業務創新中去。

Serverless工作流更多應用場景

從圖森未來的資料處理平台,看Serverless 工作流應用場景精準打造雲上自動生産線,Serverless工作流正式商用助力圖森未來,自動化資料處理平台, 讓一切簡單可靠Serverless工作流更多應用場景

各個公司會有如下的一些典型工作流場景。這裡簡單介紹三個典型應用:

訂單流程審批,可支援1年執行時長

對于電商、旅行行業的訂單,或者企業内部的日常各類申請, 從下發到生效都要經過多個環節,需要跨公司辦公網絡和公共雲的多網絡環境,途徑多個環節的多步驟分布式,可能涉及人工介入,最終資料確定強一緻性。目前Serverless工作流預設的支援最長 1 年的執行,以及并行觸發 1 萬個流程。

從圖森未來的資料處理平台,看Serverless 工作流應用場景精準打造雲上自動生産線,Serverless工作流正式商用助力圖森未來,自動化資料處理平台, 讓一切簡單可靠Serverless工作流更多應用場景

多媒體檔案處理,降低失敗率、提升吞吐量

Serverless工作流同樣适用多任務編排,比如多媒體檔案如轉碼、截幀、人臉識别、語音識别、稽核上傳等各類處理。使用者可以編排成一個完整的處理流程,通過函數計算送出媒體處理(IMM)任務(或自建處理器),産出一個符合業務需求的輸出。各任務的執行錯誤異常可以被可靠的重試,大大提升多媒體任務處理吞吐量。

對于視訊點播、 視訊轉碼等重度依賴算力的任務如果采用Serverless方式搭建,将函數計算和Serverless工作流組合使用,僅需3人天便可上線落地。

從圖森未來的資料處理平台,看Serverless 工作流應用場景精準打造雲上自動生産線,Serverless工作流正式商用助力圖森未來,自動化資料處理平台, 讓一切簡單可靠Serverless工作流更多應用場景

自動化運維,流程進度可視化跟進

自動化運維常見有步驟繁瑣時間長短不一,單機腳本可靠性低,依賴複雜等常見的挑戰,另外進度無法可視化。Serverless 工作流+函數計算的流程可以很好地應對這些挑戰。例如軟體自動化部署從建構Docker容器,上傳容器鏡像,開始并追蹤各節點下拉鏡像并啟動新版本鏡像的容器,每一步函數産生的日志會被儲存到日志服務可供查詢分享。基于工作流的自動化工具相比單機運維腳本具有高可用,自帶錯誤處理機制和進度圖形化的特點。

從圖森未來的資料處理平台,看Serverless 工作流應用場景精準打造雲上自動生産線,Serverless工作流正式商用助力圖森未來,自動化資料處理平台, 讓一切簡單可靠Serverless工作流更多應用場景

"Serverless 工作流是阿裡雲 Serverless 産品體系中的關鍵一環。" 阿裡雲 Serverless産品負責人楊皓然表示,“ 通過 Serverless 工作流,使用者能夠将函數計算、視覺智能平台等多個阿裡雲服務,或者自建的服務,以簡單直覺的方式編排為工作流,迅速建構彈性高可用的雲原生應用。”

據悉,阿裡雲在2017年推出函數計算, 該服務根據應用負載變化實時智能地彈性擴縮容,1分鐘完成上萬執行個體的伸縮并保證穩定的延時。目前已經支撐微網誌、芒果TV、華大基因、圖森未來、石墨科技等使用者的關鍵應用,輕松應對業務洪峰。

繼續閱讀