天天看點

《R語言遊戲資料分析與挖掘》一1.3 資料分析師的能力要求

1.3 資料分析師的能力要求

因為在資料化營運中,資料分析師要深入業務背景,傾聽和發現業務需求,走到業務第一線,與業務團隊并肩作戰,是以要求資料分析師具備很強的組織協調能力,具有項目大局觀,懂得在不同階段調用不同的資源。從這點來看,業務了解力和溝通能力的重要性甚至要超過技術層面的能力(資料處理能力、資料統計分析能力、資料挖掘能力、資料應用能力)。圖1-2是遊戲資料分析師需要具備的關鍵能力。

《R語言遊戲資料分析與挖掘》一1.3 資料分析師的能力要求

首先資料分析師要具備組織能力。這展現在項目前期調研、方案制定、項目開發和項目落地的職責和能力要求。

調研:深入業務背景,發現、傾聽業務需求。

方案:通過前期調研,有效判别分析需求價值,根據需求能有效提供分析解決方案。

開發:針對制定的解決方案,能通過技術手段進行項目開發。

落地:将開發成果結合業務場景進行落地,并持續跟蹤落地應用效果,修正或優化方案和模型。

資料處理能力、資料挖掘能力和資料應用能力這三大塊能力需要資料分析師通過時間、項目經驗去磨砺,不斷成長,懂得何時運用哪種資料挖掘技術解決相應的問題。

剛剛收集上來的raw data(原始資料)一般存在髒資料,不能達到直接模組化的要求。我們不能直接利用raw data進行資料分析模組化,所謂“垃圾進垃圾出”,這樣得到的分析結果也不一定是可靠的。對于raw data,我們需要評估資料品質,清洗髒資料,通常包括缺失值和異常值的處理,使之達到資料分析的需求。假如現在有一份30萬的使用者調研資料,由于某些玩家不願意填寫自己的性别、收入等,導緻這些變量存在資料缺失的情況。現在利用資料分析技術對缺失值模式進行可視化探索,如圖1-3所示。

由圖1-3可知,有2萬位玩家沒有填寫性别資訊,其中有609位玩家同時缺失性别、年齡資訊,31位玩家同時缺失性别、年齡和收入的資訊。掌握了資料缺失模式後,就知道應該運用何種技術處理這些缺失值。

《R語言遊戲資料分析與挖掘》一1.3 資料分析師的能力要求

針對異常值資料,我們同樣希望能通過科學的方式甄别異常值并處理。例如,可以利用箱線圖發現異常值,并在圖上列印出異常值的樣本号和數值,直覺地對異常值進行可視化展示。比如現在有某個月日新增使用者在第30日留存率的資料,通過普通曲線圖很難發現是否有某些天的新增在第30日留存存在異常情況。此時可以借助箱線圖的方式甄别異常值,如圖1-4所示。

《R語言遊戲資料分析與挖掘》一1.3 資料分析師的能力要求

由圖1-4可知,這個月有三天的新增使用者在第30日留存率低于正常水準,分别是5日、6日和9日。

進行資料清洗後,有時候還需要對資料進行資料整合轉換,使之符合模組化前的資料需求,常用的一種方式是添加衍生變量。所謂衍生變量,其實就是指資料分析師在分析(模組化)過程中人為增添的一些新變量,這些新變量産生之後,可以明顯提升模型的效果,或者可以有效提煉出有價值的分析結論。

資料分析師在模組化的過程中,需要根據業務需求和資料特點選擇合适的算法,利用專業的資料挖掘工具進行模組化,并評估模型效果。比如在面對使用者分析的需求時,可分别分析玩家點選行為的路徑和玩家購買的道具,根據不同的方向和目标選擇不同的算法和工具。

如圖1-5所示,在研究玩家的點選行為時,如果是單路徑情況,可以使用漏鬥圖檢視每一步的轉化情況;如果是多路徑的點選情況,可以使用sunburst事件路徑圖快速定位使用者的主要點選路徑,也可以利用社會網絡圖對玩家間的點選事件關系進行可視化。

《R語言遊戲資料分析與挖掘》一1.3 資料分析師的能力要求

在研究玩家的購買行為時,可以利用關聯規則發現購買物品之間的關系,如圖1-6所示。

《R語言遊戲資料分析與挖掘》一1.3 資料分析師的能力要求

由于業務團隊的資料分析意識和能力不如專業的資料分析師,他們大多不懂解讀模型結果。此時需要資料分析師将模型得到的知識用樸素的業務語言表達出來,進而利用分析結果指導營運和營銷活動。以圖1-6為例,業務團隊一般看不懂這個圖傳遞的資訊,需要幫他們解讀。比如圓圈越大表示兩者的關聯關系越強,很多玩家都購買過超級大禮包和新手禮包這兩個道具,在做營運活動時,可以将這兩個禮包進行捆綁銷售,提高另外一個道具的銷量。

繼續閱讀