天天看點

詳解ID拉通 | CDP 智庫系列文章 ②

作者:Marteker
詳解ID拉通 | CDP 智庫系列文章 ②

企業在日常的經營活動中,會積累大量的資料,這些資料由于來源、格式各異,容易形成一個個「資料孤島」。「資料孤島」的存在,會阻礙企業更好地認知客戶、與客戶溝通。是以,企業搭建CDP後,積累了一定的客戶ID後,首先要做的就是ID拉通(ID mapping)。

詳解ID拉通 | CDP 智庫系列文章 ②

ID與ID拉通

ID是英文Identity的縮寫,它是一種網際網路身份認證協定,具有唯一性,代表了使用者在企業中可識别的「身份」。通過對ID的管理,能夠發現使用者的個人資訊、購物喜好等有助于營銷活動的資訊,為使用者提供更好的服務。營銷人員接觸較多的ID有cookie、IDFA、Device ID、Union ID等等。

PC時代,主要的ID是cookie,企業主要依靠cookie mapping做ID拉通,相對較為容易識别客戶;而在移動網際網路時代,ID出現封閉化的趨勢,各大平台、電商管道陸續推出自己的ID,搞「封閉式管理」。對企業來說,這些ID都是與使用者相關的資料,卻各不相同,企業也就無法完整地洞察消費者甚至做營銷。是以,企業迫切需要進行ID拉通。ID 拉通是 CDP 裡面的一個很重要的功能,是使用者精細化營運的基礎,簡單來說就是将一個使用者在不同觸點的 ID 識别為同一個人。

與ID拉通意義相關聯的一個詞是「資料打通」。悠易互通CDP産品總監吳潔介紹說,ID拉通包括兩個步驟,首先是ID之間的打通,即提取出所采集到的資料裡的ID資訊,這時候會形成多個ID,再将多個ID下的行為、屬性等資料串在拉通後的ID上面,這個步驟是資料打通。也就是說,ID拉通與資料打通是銜接的過程。

悠易互通CDP資料技術專家李智敏補充說,ID拉通從功能方面來說,分為廣義和狹義的概念。從廣義來說,ID拉通就是一種資料打通,将原本存在于各個「資料孤島」的資料按照某種規則組織起來,它是包括使用者在内的各類資料,例如物品、裝置等;從狹義來說,ID拉通則是将原本分散在不同管道的使用者資料統一彙聚和拼接,形成完整的使用者資訊視圖,一般所指的實體隻包括使用者。

詳解ID拉通 | CDP 智庫系列文章 ②

ID拉通的步驟

ID拉通有強ID拉通、算法拉通等多種方法,其中最為簡單的是基于優先級的強ID拉通,對采集到的使用者屬性、使用者行為等資料直接進行關聯。這種拉通方式對資料量級和ID類型都會有一定限制,ID類型最好不超過10個,若ID類型過多,會嚴重影響計算的效率;

上述方法針對沒有形成ID關系對的資料進行拉通較為困難,是以,更為寬泛的一種拉通方式:基于某些特征資料實作的算法拉通對事實拉通進行了有效補充,算法拉通采用聚類等數學方法和技術進行計算準确率。還有一種拉通方式是第三方ID拉通,例如與騰訊、阿裡等平台方合作,可能會受限于平台方的規制,這也是企業開始追求第一方資料的重要原因之一。目前,悠易互通采用的主要是圖計算的方式,這種方式大大提升了ID拉通的計算效率,可以就任意的ID進行拉通。這種方式解決了強ID拉通方法受ID數量限制的問題,也保證了準确率,隻要拿到了資料,拉通出的結構必然是真實的。

吳潔介紹了幾種ID拉通方案的步驟。強ID拉通的方法,首先确定最高優先級,通常是手機号碼——當然一些行業會采用特殊的ID,如汽車業選擇身份證号或者車架号作為最高優先級——如果ID裡有手機号,就通過手機号拉通。還有一種規則是确定各個ID的優先級,例如依次為手機号、郵箱、Union ID等等。這種強ID拉通的方法采用的是「一對多」的形勢,但在有些條件的限制下(如使用者變更手機号),就會基于優先級形成一個新的使用者,則沒有辦法實作真正意義的拉通。

悠易互通所采用的圖計算解決的是多對多的問題。隻要所擷取的ID中有兩個能關聯起來,通過這兩個ID之間的關系,就能把其他能得到關系的ID都串聯在一起。即便缺少使用者手機号,沒有郵箱這種強PII的ID,僅僅依靠Open ID、Union ID甚至cookie,都有辦法找到關聯關系并串聯在一起,這些ID之間是沒有優先級的。

吳潔舉例說,悠易互通曾經服務一個汽車客戶,客戶剛上線了系統,用七部手機進行測試。因為有七個手機号碼,通常情況下會被識别為七個人。但在測試過程中發現,有兩個不同的手機号在一次session中登陸了客戶的賬号體系,但是顯示為一個cookie。雖然cookie的優先級較低,但在這個session裡隻有這一個cookie,形成了較強的邏輯關系,證明這兩個手機号碼所登入的兩個内部的CRM ID其實是一個ID。通過這樣的方式,這七個手機号都串成了一個人。

圖計算在ID拉通中的應用

圖計算是将各類資料關聯起來,将不同來源、不同類型的使用者 ID 資料融合到同一個圖計算模型中進行分析,得到原本獨立分析難以發現的結果。圖計算與知識圖譜相關聯,可以幫助營銷人員根據地域、社交和職業網絡、産品、品牌和購買力等次元,對複雜的顧客資料進行模組化。最初圖計算應用較多的是司法刑偵領域,理清楚犯罪嫌疑人的各種社會關系。圖計算所針對的資料并不考慮它是來自于第一方或第三方資料,而是具體的資料來源。例如營銷人員擷取了客戶的第三方交易資訊,包括有贊的會員ID,以及下單時使用的手機号碼,就可以拉通有贊ID、手機号以及内部的Union ID之間的關系。

悠易互通采用圖計算的方式,通過尋找兩兩相關的關系,形成更為穩定的ID關聯,形成使用者ID圖譜。即便使用者更換了手機号碼,隻要其他ID之間的關聯關系還存在,就可以繼承兩個手機号之間的關系,可以把他歸為同一個人。圖計算可以讓ID拉通的穩定性極大提升,更加精準識别到同一個客戶。

李智敏介紹說,圖計算描述的其實是不同對象之間的關系。類似于關系資料庫,圖計算本身是一種資料結構,包含了「點」和「邊」兩種形式:「點」指的是研究對象,對象有多個屬性;「邊」是兩點之間的線,用來說明兩者之間的關系。

圖計算的第一步是模組化,圍繞對象設計一個基礎的模型,亦即最基礎的資料單元。對于營銷人來說,第一步相當于廣告行為,了解通過廣告擷取的IDFA、OAID等資料。

第二步,設計存儲,即用何種方式存儲資料,一個對象可能涉及多種資料存儲的方式。這一步的目的在于明晰使用者行為,就是除了廣告行為之外,使用者的實際行為,比如說在小程式、官網、App等管道的行為。這一步擷取較多的是使用者的 Open ID、Union ID、cookie甚至CRM ID等等。

詳解ID拉通 | CDP 智庫系列文章 ②

第三步,基于最基礎的資料單元和存儲,設計解決方案,特别是基于圖計算的基礎概念去進行設計,描述不同對象的資料結構,理清楚資料源。這一步是為了搞清楚使用者屬性。吳潔補充說,使用者屬性如性别、年齡等相對來說比較靜态的,不是某個具體時間段發生的事情,而是用來描述使用者具體屬性特征的資訊。

第四步,一切就緒之後,開始正式的計算,描述出整個資料結構,形成一個最大聯通圖,可能涉及到成千上萬乃至上億條資料。最終将所有關系都拉通為一個One ID。

公域與私域之間的ID拉通

圖計算是基于事實的ID拉通方法,建立在擷取使用者的手機号碼基礎上;而對于家庭使用者,則是通過算法,算法依賴的條件是一定的資料特征輸入,例如ip、時間戳、UA資訊等。例如對于OTT使用者,往往缺乏使用者的登入資訊、或者其他實資訊幫助直接拉通,隻能預估這些裝置有可能屬于同一個家庭。蔡芳具體解釋說,現在每個家庭都有一個固定的WiFi,以此為前提,如果手機登入了悠易互通所掌握的流量中的一些資源,也就是拿到廣告曝光點選的日志,日志裡會有使用者的IP時間戳,能看到IP和出現的時間,與家中的OTT的IP和時間做比對,找出這些資訊之間的特征,再通過頻次等門檻值過濾掉家中訪客等情況,最後形成裝置與裝置之間的關系,以此來映射家庭中的資料結構。

當然,這種基于算法的ID拉通的準确性,不如基于事實的ID拉通。營銷人往往會在算法拉通與事實拉通之間有一個優先級的判斷。如果一個ID的算法拉通也實作了,事實拉通也實作了實名關系對,肯定會優先選擇事實拉通。

公域與私域之間的拉通,因為媒體平台的封閉性,也主要是基于算法拉通。吳潔介紹說,為了實作拉通,必然會損失一部分精準度,亦即找到準确性和拉通率中間的平衡點,最終形成一個大家都認為資料可行的值。蔡芳提出,如果ID拉通的目的是為了進行一對一的溝通,對精準度的要求是很高的;但是很多營銷活動的目的是為了做廣告,對于規模的要求大于準确性,不能因為追求準确的比對,而隻有很少的一部分ID拉通,達不到一定規模,廣告也沒有效果。是以廣告是要犧牲一部分精準度,在規模和精準之間取得平衡的。

悠易互通也會遇到客戶的特殊要求,拉通一些特殊的資料,即除了手機号碼、Device ID或者cookie等常用ID之外的系統ID。這時候,悠易互通會在原本基礎上做一些擴充。吳潔介紹說,悠易互通曾經服務某個車企,客戶有非常明确的資料安全要求,在前端做埋點上報的時候,不會提供任何形式的手機号,僅僅提供CRM ID,也就是使用者登入了官網或者小程式後的資訊。但是CRM ID是客戶自己生成的字元串,沒有辦法應用。這時候,需要将CRM ID與業務後端的某個ID拉通,再找出業務後端對應的手機号碼,去做下遊的應用。通過這種擴充方式,才能夠支援基于CRM ID的拉通,找出CRM ID對應的手機号碼,并且把号碼輸出給悠易互通的營銷自動化平台進行其他營銷活動。目前,悠易互通的系統不僅僅針對某個客戶做非定制化開發,任何客戶隻要定義ID屬于哪個外部系統,并且在外部系統中唯一可辨別使用者的,悠易互通都可以對整個業務實作ID拉通,最終形成應用閉環。

需要強調的是,整個ID拉通過程都是在客戶的第一方資料庫裡進行計算,而且在對使用者資料進行處理的時候,需要對手機号碼、open ID等資料進行MD5的32位加密,再進行計算拉通。MD5即MD5消息摘要算法,一種被廣泛使用的密碼散列函數,可以産生出一個128位(16個字元)的散列值(hash value),用于確定資訊傳輸完整一緻。

吳潔介紹說,悠易互通采取了兩種識别方式:如果上遊提供的明文資料,悠易互通會做一層加密處理;如果上遊提供了32位加密資料,悠易互通會保持加密結果。而在輸出的時候,如果是MD5的資料,輸出的時候同樣保持MD5;如果上遊提供了明文資料,下遊可以選擇明文或者MD5。

ID拉通不僅僅是技術問題

ID拉通涉及大量的技術,但不僅僅是一個技術問題,用蔡芳的話說,它其實是一個營運問題。讓使用者通過廣告觸及小程式、H5頁面,甚至授權手機号,最終從匿名實作實名化,都需要一系列的營運方式。特别是客戶需要有ID拉通的意識,知道ID拉通對企業的消費者營運非常重要。

蔡芳介紹說,悠易互通的某些客戶,希望通過不錯的官網流量實作轉化,但是在注冊會員這一步驟,使用的是郵箱注冊,使用者需要回到郵箱收取驗證,再跳轉回來完成注冊,而在公衆号、小程式等管道,沒有一個地方讓使用者輸入郵箱。這樣做,使得網站的注冊使用者無法與公衆号、小程式打通。

詳解ID拉通 | CDP 智庫系列文章 ②
詳解ID拉通 | CDP 智庫系列文章 ②

其實對于客戶來說,最好的方式是讓使用者授權手機号,首先是降低門檻,讓使用者通過小程式等比較便捷的方式留下手機号,而不是用填表單、填郵箱位址等使用者較為抵觸甚至會給使用者帶來麻煩的方式;其次是創造一些場景,讓使用者願意留下手機号碼,如發紅包、注冊有獎等方式。悠易互通的某個快消品客戶,在春節用發紅包的方式,擷取了一個億的手機号碼,實作了手機号與Union ID的拉通。

案例-悠易互通為某車企拉通One ID

某汽車品牌計劃推出一款新能源車型,采用DTC模式,即通過小程式、官網、APP等自有管道售賣。客戶希望搭建目标使用者的私域流量池,即将以往的老客戶以及通過廣告、線上注冊等活動搜集的新客戶都引入新使用者平台,并基于這個平台發起種草、主題活動等營銷活動,讓使用者對新款車型有深入了解乃至互動。

由于這些使用者在不同系統注冊了不同的賬号,客戶希望把這些使用者識别為One ID。使用者現有的資料量有幾十萬,但是資料維護的工具僅僅是Excel。客戶希望定期做一些活動,與老車主互動,但是用Excel顯然無法完成。基于這樣的背景,客戶委托悠易互通搭建CDP,主要解決私域資料采集的問題。

客戶有專門的數字化部門,但是整體負責CDP項目的其實是市場部,市場部内部有一些資料分析人員、會員營銷人員、活動組織人員。換句話說,市場部是CDP的主要使用者。至于其它APP、小程式等産品開發,有單獨的部門負責設計,以及外包給供應商做開發。市場部希望通過CDP,完成資料分析、人群圈選等工作,并以此為基礎,通過觸點采集到一些優質的leads,在後續的銷售過程中形成轉化。

經過分析,客戶掌握的資料源,主要有老車主的資料(包括車牌号、電話以及其他基礎資訊),私域流量資料(包括官網資料)。在埋點過程中,能擷取到官網資料的cookie資訊,小程式可以擷取使用者的Open ID,UNI ID,以及授權之後的手機号碼;App端可以獲得一定的Device ID。

值得一提的是,客戶搭建了很強的登入注冊體系,某一個時間段的KPI就是注冊的新使用者量,而在注冊的過程中,出于資料安全的考慮,前端并不上報任何的實名手機号資訊。此前,悠易互通所支援的ID拉通的範圍,主要支援市場上通用的ID類型,包括Open ID,Union ID,手機号,cookie都在拉通範圍之内。但是實名制情況下,如果使用者在前端不上報手機号碼,就意味着這些非實名的ID沒有一個key去進行拉通。

這時,客戶提供了幫助,前端上報的時候會提供CRM ID,也就是上報的使用者在注冊完成之後,後端業務系統裡會生成一個CRM ID,這個CRM ID與手機号碼有對應關系,CRM的資料通過業務後端上傳到CDP。也就是在整個前端拉通的過程中,可以拉通cookie與CRM ID的關系,以及CRM ID與Open ID以及Union ID的關系,甚至拉通CRM ID 和MA或者IDFA的關系,最終實作全鍊路的拉通。

在拉通過程中,出現了一些異常ID,需要從系統中剔除,而引發了一些清洗工作,讓這些ID産生的資料不入庫。此外,悠易互通的CDP産品在過程中進行了更新,也能夠支援任意業務後端的ID進入ID拉通的體系之中。

出于資料安全的考慮,客戶要求所有上遊資料能夠進行MD5加密,其中涉及到一些曆史資料。悠易互通先行将這些沒有MD5加密的手機号碼先進行了加密處理,再用于拉通,還能反向查出來MD5對應的手機号碼的明文或者密文,也就是傳上來的原值。

資料拉通最終形成的One ID,包括Open ID、Union ID、Device ID、手機号、cookie等不同來源資料的數組,以及不同外部系統自己的ID。例如除了CRM,One ID還與呼叫中心的資料進行打通,呼叫中心生成的使用者的ID也納入ID拉通的範疇。

詳解ID拉通 | CDP 智庫系列文章 ②

悠易全域CDP先找到前端使用者行為發生時的CRM ID,拉通之後,用拉通後的OneID再找到後端CRM ID對應的手機号碼,接下來就可以進行短信發送等各項營銷活動。

繼續閱讀