天天看點

資料挖掘與資料化營運實戰. 3.8 使用者(買家、賣家)分層模型

<b>3.8 使用者(買家、賣家)分層模型</b>

使用者(買家、賣家)分層模型也是資料化營運中常見的解決方案之一,它與資料化營運的本質是密切相關的。精細化營運必然會要求差別對待,而分層(分群)則是差別對待的基本形式。

分層模型是介于粗放營運與基于個體機率預測模型之間的一種折中和過渡模型,其既兼顧了(相對粗放經營而言比較)精細化的需要,又不需要(太多資源)投入到預測模型的搭建和維護中,因而在資料化營運的初期以及在戰略層面的分析中,分層模型有着比較廣泛的應用和較大的價值。

正如預測模型有特定的目标變量和模型應用場景一樣,分層模型也有具體的分層目的和特定用途,這些具體的目的和用途就決定了分層模型的建構思路和評價依據。其常用的場景為:客戶服務團隊需要根據分層模型來針對不同的群體提供不同的說辭和相應的服務套餐;企業管理層需要基于線上交易賣家數量來形成以其為核心的賣家分層進化視圖;營運團隊需要通過客戶分層模型來指導相應的營運方案的制訂和執行,進而提高營運效率和付費轉化率等。這些分層模型既可以為管理層、決策層提供基于特定目的的統一進化視圖,又可以給業務部門做具體的資料化營運提供分群(分層)依據和參考。

分層模型常用的技術既包括統計分析技術(比如相關性分析、主成分分析等),又可以含有預測(響應、分類)模型的技術(比如通過搭建預測模型發現最重要的輸入變量及其排序情況,然後根據這些變量對分層進行大緻的劃分,并通過實際資料進行驗證),這要視具體的分析目的、業務背景和資料結構而定,同時要強調的是,一個好的分層模型的搭建一定是需要業務方的參與和貢獻的,而且其中的業務邏輯和業務思考遠遠勝過分析技術本身。

下面我們分别用兩個典型的案例來說明分層模型是如何搭建和應用的。

案例一:以交易賣家數量為核心的賣家分層進化視圖

背景:某網際網路公司作為買賣雙方的交易平台,其最終的價值展現在買賣雙方在該平台上達成交易(進而真正讓買賣雙方雙赢,滿意)。現在,管理層希望針對線上成交的賣家(群體)形成一個分層進化的視圖。其基本目标就是,從免費注冊的賣家開始,通過該視圖可以粗略地、有代表性地勾畫出賣家一步一步成長、進步乃至最終達成交易的全過程。這裡的每一層都是一個或幾個有代表性的重要名額門檻,順着不同的門檻逐漸進化,越往上走,人群越少,越有可能成為有交易的賣家,而最後最高一層将是近30天來有交易的賣家。從這個背景和目标描述裡,我們可以大緻想象出這個分層模型是一個類似金字塔的形狀(底部人數多,越往上越小,表示人群在減少)。

這個分層模型的主要價值展現在:可以讓管理層、決策層對交易賣家的成長、進化、過濾的過程有個清晰、直覺的把握,并且可以從中直覺地了解影響賣家交易的一系列核心因素,以及相應的大緻門檻閥值,也可以讓具體的業務部門直覺地了解“培養成交賣家,讓賣家能線上成交”的主要因素,以及相應的營運抓手。

在本案例中,有必要了解一些關鍵的業務背景和業務因素,比如要想線上交易,賣家的offer必須是“可線上交易offer”。這個條件很關鍵,所謂“可線上交易offer”是指該商品的offer支援支付寶等第三方線上支付手段,如果賣家的offer不支援這些手段,那就無法線上交易,也就無法滿足本課題的目标了。是以,這裡的“賣家offer必須是可線上交易offer”是一個前期的重要門檻和閥值,從此也可以看出,對業務背景的了解非常重要,它決定了課題是否成功。

下面來談談具體的分析思路,先是從最基本的免費注冊的賣家(即“全會員”)開始,之後是近30天有登入網站的賣家(說明是“活”的賣家,這裡經過了直覺的業務思考),再到近1年有新發或重發offer的賣家,然後是目前有效offer的賣家,最後是目前有可線上交易offer的賣家,這個分析過程其實是第一部分的思考,它們構成了金字塔的下半部分,基本上是基于業務背景的了解和順理成章的邏輯來“進化”的,之是以在“全會員”與“目前有可線上交易offer”之間安插了另外3層逐漸“進化”的名額,主要也是基于業務方需要門檻的進度和細分的考慮,但這不是主要的核心點。

接下來,從“目前有可線上交易offer的賣家”開始,層層進化到最高端的“近30天有線上交易的賣家”,也就是找出影響賣家成交的核心因素,并将之提煉成具體的層級和門檻,這一部分則是本案例的重點和核心所在。

如何找出其中的核心要素以及重要性的先後順序?在本課題中,使用了預測(分類、響應)模型的方法,即通過搭建預測(響應)模型(目标變量是“近30天是否線上成交”,輸入變量由資料分析團隊與業務團隊共同讨論确定),并通過多種模型算法的比較,最後找出決定交易的幾個最重要的輸入變量及先後次序。

最終的分層模型大緻如圖3-3所示,限于企業商業隐私的考慮,針對該資料做了處理,請勿對号入座。

圖3-3 交易賣家分層示意圖

該金字塔每一層裡的數量代表滿足該條件的會員(賣家)數量,而且各層之間的條件是連貫且相容的,比如,從下往上數,第6層“目前有可交易offer”的使用者有204萬人,占其前一層“可交易行業賣家”269萬人的76%,而且該層的使用者必定是同時滿足其下5層的所有條件的(包括來自可交易行業,目前有有效offer,近1年有新發或重發offer,近30天有登入網站或即時通信工具等)。

細心的讀者可能會發現,最頂層的人數是31萬,占近30天有交易賣家總數的71%,為什麼不能占近30天有交易賣家總數的100%?這個差距正是由金字塔模型的本質所決定的,無論這個層層進化的金字塔模型多麼完美,它還是無法完全圈定有交易賣家的總數,總是有一部分有交易的賣家不是滿足上述金字塔上半部分的那些條件、門檻、閥值。這也是類似的分層模型隻能看大數、看主流的主要原因和特點,但是隻要這個模型可以圈定大多數的人群(比如本項目實作的71%,或者更高),那它就有相當的代表性,就可以作為相應的決策參考和業務參考。

當然,這個模型是否可以投入應用,還需要進一步檢驗,正常的檢驗方法就是通過不同時間段的資料,看是否有相似的規律、門檻、占比、漏鬥,也就是看這個金字塔的結構是否具有一定時間長度的穩定性。在本項目中,我們通過前後各半年的資料分别進行了驗證,發現這個金字塔的結果總體還是比較穩定的,确實可以作為決策參考和業務借鑒。

案例二:客戶服務的分層模型

背景:a産品是一個線上使用的付費産品,其主要功能就是讓賣家實時獲悉來自己網店的買家,可以讓賣家通過主動對話促成雙方的交談,一旦對上話,賣家就可以得到由系統提供的買家聯系方式等。很明顯,該産品的核心功能(賣點)就是讓賣家第一時間抓住來店鋪的買家,并通過對話拿到買家的聯系方式,友善後期的跟進,直至達成交易。現在該産品的客戶服務團隊正在負責付費使用者的後期續費工作,該客服團隊希望資料分析師幫他們制作一個付費使用者的分層模型,在業務方的設想中該模型至少有3層,每一層可以對應相應的客服方案來幫助該層客戶解決問題,模型的最終目的是促進付費客戶的續費率穩步提升。具體來說,業務方希望根據業務敏感和客服資源儲備,對付費使用者進行3個群體的劃分,每個群體有明确的業務診斷和客服方案(第一個群體,“體質差的客戶群體”,比如訪客數比較少,并且客戶登入線上平台的次數也比較少(導緻雙方握手交談可能性不高),這群客戶被認為是最次要關注的;第二個群體,“問題客戶群體”,比如對該産品的功能點使用都很少的客戶,針對這群客戶,客服團隊可以對他們提供有針對性的産品功能教育;第三個群體,“生死線客戶”,這群客戶特點是有相對而言數量較多的訪客,但是他們很少主動洽談(以至無法拿到買家的聯系方式,影響後期的成交),之是以稱之為“生死線客戶”,是因為客服團隊希望作為重點關懷的群體,把他們從産品使用的“無效性”上拉回來,把他們從可能流失(續費)的生死線上拉回來(這群客戶有理由從産品中獲益(拿到買家聯系方式),隻是他們沒有主動聯系客戶,如果他們能主動與買家洽談,進而拿到聯系方式,他們的成交業務有理由明顯上升)。

該案例的分層模型用不上複雜的模組化技術,隻需要基于簡單的統計技能就可實作。在深度把握産品價值和業務背景的前提下,我們與業務方一起基于他們設想的3個細分群體,根據實際資料找出了相應的具體閥值。具體來說,針對“體質差的客戶群體”,基于訪客數量和自身登入平台的天數和次數,進行兩維資料透視,就可以找到滿意的閥值和門檻定義;針對“問題客戶群體”,隻需要針對各功能點使用情況的10分位,找出最低的20%~30%使用者就可以了;針對“生死線客戶群體”,同樣是基于訪客數量和自身主動洽談的次數,進行兩維資料透視,也可以找到滿意的閥值和門檻定義,這樣就能根據資料分布情況找到有很多訪客,同時主動洽談次數很少的客戶群體。上述群體劃分的方法主要是基于業務了解和客服團隊的資源配備的,事後的方案驗證也表明,該種群體劃分不僅能讓業務方更容易産生了解和共鳴,也能很好地穩定并提升付費使用者的續費率。

繼續閱讀