天天看點

如何基于大資料及AI平台實作業務系統實時化?

作者:高旸(吾與),阿裡巴巴進階技術專家

1. 前言

随着網際網路“人口紅利”的“消耗殆盡”,基于“T+1”或者離線計算的機器學習平台及推薦系統轉化率與效果日趨“平淡”。後疫情時代的新社會模式及經濟形态必将催生出新的商業模式,線上業務及相關應用場景的流量呈現井噴式發展,正常的離線系統及離線機器學習平台已無法滿足業務發展要求。人口紅利吃盡之後,基于大資料及AI平台的業務系統在時間次元上的思考将變得至關重要,通過業務系統實時化向時間要價值已經成為主流趨勢。基于流式計算引擎的線上機器學習平台将越來越被重視, 通過增量模型的準實時或實時推薦系統更能“因時而異” 充分捕捉目标使用者瞬息萬變的需求,進而進行精準推薦和變現。實時推薦系統也從最早的電商場景, 擴充到社交場景, 線上教育場景, 遊戲場景及更廣闊的線上場景。

本文介紹重點介紹基于阿裡雲大資料及AI産品家族的實時計算Flink及PAI Alink機器學習算法平台,以及該産品組合在實時推薦場景(适用于電商、遊戲及線上教育解決方案)、實時評分卡場景(适用于金融、安全及營銷風控解決方案)以及異常檢測場景(适用于工業領域及其他産業網際網路領域)的場景應用。

2. 實時計算引擎及機器學習算法平台介紹

2.1 阿裡雲實時計算Flink

阿裡雲實時計算Flink作為Apache Flink創始團隊的商業化産品,從極緻(較傳統微批模式)的實時資料處理次元,為企業大資料處理及業務實時化提供了可能。商業化的統一開發及管控平台,成熟、準标準化的SQL及中繼資料管理能力,讓業務人員及資料分析師大幅度提升開發效率, SQL配合UDF基本可以解決80%+的業務場景。企業級的State Backend – Gemini大幅度提升IO效率,整體執行引擎較開源3倍以上的性能提升。

如何基于大資料及AI平台實作業務系統實時化?

基于阿裡雲Kubernetes的全新Serverless全托管雲上實時計算Flink服務,使用全新的硬多租技術方案,基于VPC提供網絡層隔離,阿裡雲安全容器提供計算層隔離,基于彈性雲盤提供存儲級隔離,通過使用者級Master及超級Master實作極緻資源彈性下的多租戶隔離。基于負載的細粒度彈性伸縮, 充分提高資源使用率, 降低整體TCO。新一代的Serverless實時計算Flink産品為線上機器學習算法平台提供了堅實(“時“)的基礎。

如何基于大資料及AI平台實作業務系統實時化?

2.2 阿裡雲PAI Alink機器學習算法平台

如何基于大資料及AI平台實作業務系統實時化?

與SparkML算法相比,Alink算法更全面,性能更優異,場景更豐富(同時支援流批),本地化更出色(支援中文分詞)是快速搭建線上機器學習系統的不二之選。

如何基于大資料及AI平台實作業務系統實時化?

3. 基于實時計算Flink-機器學習場景介紹:

3.1實時推薦場景:

從根據使用者點選和浏覽的内容實時推送的電商場景,到社交媒體根據使用者閱讀的内容實時“喂送“的實時推薦系統,再到遊戲推送平台根據使用者行為實時推送的遊戲系統,實時推薦系統俨然已經成為了線上業務系統的核心。

如何基于大資料及AI平台實作業務系統實時化?

阿裡雲PAI Alink算法平台提供: 召回(例如:ALS、FM、Deep Walk等),特征編碼(OneHot、MultiHot及GBDT等) ,排序(LR及FFM等)以及Online算法(OnlineFM及Ftrl)流式和批式的算法能力全流程建構能力。配合阿裡雲實時計算Flink海量樣本實時拼接能力,能夠快速端到端實作離線上一體化的推薦系統。

如何基于大資料及AI平台實作業務系統實時化?

通過特征工程批式訓練初始化模型,通過實時樣本拼接配合流式算法(OnlineFM及Ftrl) 生成增量的模型,最終提供統一模型的整體結果預測,更實時更動态的提升推薦效果。

如何基于大資料及AI平台實作業務系統實時化?

3.2 評分卡場景介紹:

阿裡雲實時計算Flink及PAI Alink産品組合可以幫助客戶快速搭建實時金融風控解決方案。評分卡在金融場景有廣泛的應用,能否建構準确的評分卡模型關系到能否安全的開展支付、貸款、保險、理财、信用等業務,評分卡常被用于信用評估領域,比如信用卡風險評估,貸款發放;評分卡也會用來作為分數評估,比如客戶品質打分,信用分。涉及金融的場景都需要:可追溯、可審計及可解釋,如下的評分卡模型就具備很好的可解釋性。例如:使用者年齡27歲,性别男,婚姻狀況已婚,學曆大學,月收入10000。根據如下評分卡,該使用者的評分為:評分 = 223(基準分) + 8(年齡) + 4(性别評分)+ 8(婚姻狀況)+ 8(學曆評分)+ 13(月收入評分)= 264分。

如何基于大資料及AI平台實作業務系統實時化?

阿裡雲實時計算Flink及PAI Alink産品組合提供最先進的評分卡解決方案, 分箱将每個特征按照需求進行分箱訓練;評分卡訓練生成評分模型;樣本穩定性通過PSI等名額衡量樣本穩定性;模型評估,評估二分類模型效果。該解決方案支援多特征次元模型訓練,支援大規模樣本模組化。

如何基于大資料及AI平台實作業務系統實時化?

3.3 異常檢測場景

異常檢測及時序分析是一個較為常見并且應用廣泛的場景,在工業界的應用尤甚。利用阿裡雲實時計算Flink及PAI Alink産品組合可以幫助客戶快速搭建異常檢測解決方案。實時計算Flink強大的性能與Alink豐富的算法庫機相結合,可以幫助資料分析和應用開發人員實作資料處理、特征工程、模型訓練、預測等多個環節端到端的處理。在異常檢測場景下,Alink支援時間序列異常檢測、異常集檢測兩個核心場景。

在時間序列異常檢測中,Alink具備種類齊全、批流一體、性能優異、并行計算、使用友善等優勢。針對不同的使用場景,分為基于時序預測和時序分解兩種類型:

  • 時序預測算法适合流式資料,即時響應
  • 時序分解算法适合全量資料,能夠從全量資料中挖掘有效資訊。

Alink也提供了時序預測和時序分解算法,使用者可以單獨使用。

如何基于大資料及AI平台實作業務系統實時化?

異常集檢測是風控場景的核心訴求之一。Alink 異常集檢測中具備如下優勢:

  • 巨型圖支援 - 支援上億邊的圖資料
  • 線上更新 - 随時加上異常種子均可局部異常檢測
  • 快速運算 - 隻對局部圖進行運算,節約計算資源

在盜用、欺詐、作弊、商戶、借貸套現等各風險域都有異常集檢測的需求存在。基于GraphRAD,Alink實作了半監督的異常集檢測,RiskCommunityDetector。算法輸入連接配接關系以及已知的黑點,即可對全圖進行分析,捕獲其它黑使用者,降低業務運作過程中的風險,為業務安全保駕護航,避免可能發生的重大損失。

如何基于大資料及AI平台實作業務系統實時化?

4. 後記

通過上文的介紹,想必大家已經對阿裡雲實時計算Flink及PAI産品組合躍躍欲試了,可以快速開通全托管實時計算Flink 體驗最新的Serverless産品服務。實時計算Flink觸達直通車:

https://www.aliyun.com/product/bigdata/sc
如何基于大資料及AI平台實作業務系統實時化?

通過開通阿裡雲E-MapReduce Dataflow叢集,快速搭建基于阿裡雲實時計算Flink的PAI Alink算法平台。PAI Alink觸達直通車:

https://www.aliyun.com/product/emapreduce
如何基于大資料及AI平台實作業務系統實時化?

實時計算 Flink 版産品交流群

如何基于大資料及AI平台實作業務系統實時化?
阿裡雲實時計算Flink - 解決方案: https://developer.aliyun.com/article/765097 阿裡雲實時計算Flink - 場景案例: https://ververica.cn/corporate-practice 阿裡雲實時計算Flink - 産品詳情頁: https://www.aliyun.com/product/bigdata/product/sc