業務背景
在業務發展過程中有兩個重要的環節,一個是拉新,另一個是留存。如何做到使用者的留存需要很多技術手段保證,一個比較重要的方式是建立使用者流失模型,通過學習曆史上流失使用者的特點,通過機器學習的手段訓練處風控模型,隊可能會流式的使用者進行預測,然後可以提前通過營運手段做一些使用者流失的防範。
業務痛點
目前使用者流失預警監控是業内主流的需求之一,但是缺少智能化的預測手段和機制。目前主流的一些預警方案都是基于一些規則的方案,對于一些潛在可能流失的使用者沒有很準确的發掘手段。
解決方案
PAI平台提供了一套基于打标資料的特征編碼、分類模型訓練、模型評估的方案。
1.人力要求:需要具備基礎的模組化背景知識
2.開發周期:1-2天
3.資料要求:最好有超過千條的打标資料,打标哪些客戶在哪種特征情況下流失過,資料越多效果越好
資料說明
資料來自真實的電信領域客戶行為資料,包含使用者的基本屬性以及使用者是否會流失,資料一共7043個使用者樣本。

特征資料:
參數名稱 | 參數描述 |
---|---|
customerid | 使用者ID |
gender | 性别 |
SeniorCitizen | 是否是個市民,1是,0不是 |
Partner | 是否有Partner |
Dependents | 是否有從屬關系 |
tenure | 客戶在這個公司使用的時長 |
PhoneService | 是否有手機服務 |
MultipleLine | 是否有多條線路 |
InternetService | 網際網路服務商DSL、Fiber optic、No |
OnlineSecurity | 是否有網際網路線上安全問題 |
OnlineBackup | 是否有線上支援 |
DeviceProtection | 是否有服務保護 |
TechSupport | 是否申請過技術支援 |
StreamingTV | 是否有流TV |
StreamingMovies | 是否有流電影 |
Contract | 合同時限,Month-to-month、Two year |
PaperlessBilling | 是否有電子賬單 |
PaymentMethod | 付款方式 |
MonthlyCharges | 月消費 |
TotalCharges | 總消費 |
目标資料:
churn | 使用者是否流式 |
流程說明
進入PAI-Studio産品:
https://pai.data.aliyun.com/console該方案資料和實驗環境已經内置于首頁模闆:
打開實驗:
1.資料源
上文提到的使用者流式使用者的資料
2.特征編碼
通過One-hot以及SQL元件實作特征工程模組化,将原始的字元型特征轉為數值型特征。
以目标字段churn為例,原始資料是“Yes”和“No”,可以通過SQL語句把"Yes"變為1,“No”變為0:
select (case churn when 'Yes' then 1 else 0 end) as churn from ${t1};
3.模型訓練
将資料分成兩部分,一部分作為訓練集訓練模型,另一部分做預測集驗證模型效果。使用者流失預警是個二分類問題,一個使用者隻有流失和不流失兩種可能性。是以選用二分類算法來處理,生成的分類模型可以一鍵部署為RestfulAPI服務供業務方調用。
4.模型效果驗證
通過二分類評估元件驗證模型準确性,準确性描述名額AUC可以達到0.83,也就是說預測的準确性在80%左右。
總結
使用者流失預警是所有B端客戶都可能應用到的場景,PAI提供了一套完整的基于使用者特征的算法,可以幫助客戶在1-2天快速實作使用者流失模型的訓練,大大提速了整個實驗搭建的周期。>