移動網際網路時代,精細化營運逐漸成為企業發展的重要競争力,“使用者畫像”的概念也應運而生。使用者畫像是指,在大資料時代,企業通過對海量資料資訊進行清洗、聚類、分析,将資料抽象成标簽,再利用這些标簽将使用者形象具體化的過程。使用者畫像的建立能夠幫助企業更好地為使用者提供針對性的服務。
與之相應,越來越多的第三方大資料公司,也開始依托自身的資料積累,為客戶提供使用者畫像的服務。比如個推旗下的使用者畫像産品,能夠對使用者線上和線下行為進行大資料分析,幫助APP開發者和營運者建構全面、精準、多元的使用者畫像體系。下文将以個推使用者畫像産品為例,詳解“使用者畫像”的技術特點和使用價值。
使用者畫像的形成需要經曆四個過程,資料積累、資料清洗、資料模組化分析、資料産出。其中,資料清洗和資料模組化統稱資料處理。在經過資料處理之後,個推産出獨特的冷、熱、溫資料次元,并分析使用者的線上興趣偏好和線下行為場景,形成使用者畫像。
一、使用者畫像用了哪些技術?
在資料處理階段,個推使用者畫像産品的大資料計算架構采用了Kafka分布式釋出訂閱消息系統,具有高吞吐量、高穩定性的特點。資料清洗可利用HADOOP、SPARK來實作裝置唯一性識别、行為資料的清洗等,去除備援資料。這一過程支援互動計算和多種複雜算法,并支援資料實時/離線計算。
在資料模組化的過程中,個推使用者畫像産品主要利用了機器學習中的聚類(無監督學習)和深度學習技術,讓模型對使用者行為資料主動學習,進行行為判斷,由此産出使用者标簽。
經過資料的清洗和模組化,個推使用者畫像會形成冷資料畫像、溫資料回溯、熱資料場景和定制化标簽四種畫像。
冷資料畫像,是指基于大資料的分析得出的使用者屬性,相對比較穩定,如使用者的年齡層次、性别、常駐地等。“溫資料”則可以回溯使用者近期活躍的線上和線下場景,具有一定的時效性。“熱資料”是指使用者當下的場景及實時的使用者特征,幫助APP營運者抓住稍縱即逝的營銷機會。定制化标簽是将個推資料與第三方資料結合起來,共同模組化得出具有價值的特征标簽。
二、如何建構使用者畫像?
“使用者畫像”的建構需要技術和業務人員的共同參與,以避免形式化的使用者畫像。個推建構使用者畫像時流程如下:
(1)标簽體系設計。開發者需要先了解自身的資料,确定需要設計的标簽形式。
(2)多資料源資料融合。在建設使用者畫像時,個推會整合自有海量資料以及該APP自身的資料。
(3)實作使用者統一辨別。多數情況下,APP的衆多使用者分布于不同的賬号體系中,個推會将其統一辨別,幫助APP打通賬号,實作資訊快速共享。
(4)使用者畫像特征層建構。即将每一個資料進行特征化。
(5)畫像标簽規則+算法模組化。兩者缺一不可,在實際的應用中,算法難以解決的問題,利用簡單的規則也可以達到很好的效果。
(6)利用算法對所有使用者打标簽。
(7)畫像品質監控。在實際的應用中,使用者畫像會産生一定的波動,為了解決這個問題,個推建設了相應的監控系統,對畫像的品質進行監控。
總之,個推使用者畫像建構的整體流程,可以概括為三個部分:
第一,基礎資料處理。基礎資料包括使用者裝置資訊、使用者的線上APP偏好以及線下場景資料等。
第二,畫像中間資料處理。處理結果包括線上APP偏好特征和線下場景特征等。
第三,畫像資訊表。表中應有四種資訊:裝置基礎屬性;使用者基礎畫像,包括使用者的性别、年齡層次、相關消費水準等;使用者興趣畫像,即使用者更有興趣的方向,比如使用者更偏好拼團類APP還是海淘類APP;使用者其它畫像等。
在個推使用者畫像建構的過程中,機器學習占據了較為重要的位置。機器學習主要應用在海量裝置資料整理、資料清洗、資料存儲的過程中。
三、使用者畫像能做什麼?
使用者畫像對電商類、新聞資訊類APP的作用不言而喻,可以幫助APP打造精準推薦系統,實作千人千面的營運。
基于使用者特征的個性化推薦
APP的營運者可以通過個推使用者畫像提供的性别、年齡層次、興趣愛好等标簽,分别展示不同的内容給使用者,以達到精準化營運的目的。
基于使用者特征指導内容推薦
基于使用者特征指導内容的推薦是指找到與目标群體相似的使用者群,并利用該相似使用者群的行為特征對目标使用者進行内容推薦,具體過程如下圖:
在實作這一内容推薦的過程中,相似性模組化技術起着不可忽視的作用。相似性模組化可類比于聚類模組化,是無監督學習中的一種。它可以尋找資料中的特征,把具有相同特征的資料聚集在一組,并賦予這些聚集在一起的資料相同的特征标簽。根據這些特征标簽,尋找具有這些特性的使用者,給他們推送相同的内容。
這種推薦方式的優點是,它的自有特征是經過APP長期積澱而來,顆粒度更細,适用性更強,對使用者的認識更全面,效果能持續提升。而且它還能針對APP所處行業與自身需求,量身定制比對算法,讓推薦更精準。
此外,個推使用者畫像能夠結合第三方資料做定制化模組化,通過雙方共同模組化得出顯著價值和特征标簽。這種标簽增補的方式不僅能保證推送的内容更精準,同時也可以很大程度地提升流量價值。
四、開發者如何接入?
個推使用者畫像SDK的接入主要有兩個方式:
• SDK內建:用戶端內建個推使用者畫像SDK,進行初始化SDK後,傳回給客戶一個ID即GIUID(唯一身份辨別), 此ID需要由用戶端送出到客戶伺服器,然後伺服器通過API接口傳入GIUID進行查詢使用者畫像标簽資料。
• API接口調用:客戶将應用名稱、包名及服務端出口IP提供後,傳回APP ID等相關資訊。客戶根據《個推使用者畫像資料服務接口文檔》及《使用者畫像編碼表》內建測試後方可調用API接口查詢畫像資訊。
具體的內建文檔參見以下連結:
Android:
http://docs.getui.com/gexiang/start/android/iOS:
http://docs.getui.com/gexiang/start/ios/服務端:
http://docs.getui.com/gexiang/start/server/了解使用者,是為了更好地服務使用者。正是APP開發者和營運者對使用者認知的渴求促生了使用者畫像。而APP開發者隻有把使用者的需求放在最重要的位置,才能更好地優化使用者的體驗,留住使用者。接入個推畫像SDK,不僅可以幫助開發人員提高開發決策的效率,也可以幫助APP營運人員開展精細化營運,進而提升企業的營銷效率和市場競争力。