畫像分析體驗總結
整體分為兩個部分
标簽管理
1、配置對應的資料源,将資料源表定義為“實體”,字段定義為标簽
2、配置同步計劃和任務,進行資料的同步管理
3、類似于資料的映射,将技術語言與業務語言通過實體,關系,标簽進行映射。
群體畫像
1、主要是關注業務上每個字段的篩選,過濾條件,組合出滿足業務要求的分析場景
2、提供了群體計算、群體分析、群體對比、相似度分析,使得從業務的角色能更快速、更靈活、更主觀的操作資料
3、通過多種圖表方式展現圈定的結果。
體驗前後的差異對比
沒有使用阿裡産品前的實作方式
每一次業務規則的調整,都需要修改代碼,重新執行,才能得到最新的結果
使用阿裡産品的實作方式
隻需要在界面上重新配置過濾規則,然後執行篩選,就能得到最新的結果,并能通過多種圖表方式直覺 的呈現出來。
特點
省去了重新修改代碼的環節,從業務的角度調整規則即可實作畫像分析。随着多種圖表展現形式對結果的回報,可以不斷的完善規則,進而提高了畫像分析的準确性和時效性。
适用場景
基礎的标簽(名額)資料生成好後,提供給業務人員,進行業務角度的資料分析使用,可以快速的将群體方案直接釋出為API對外提供。
目标與操作過程
本次目标
1、嘗試用這份資料找分析出,高壓力中年油膩男,單身帶娃,無父母補貼,低學曆,高年齡
2、嘗試用這份資料找分析出,單身女強人,單身無娃,有父母補貼,高學曆,中低年齡
前提條件 -- 資料準備
一、準備資料源
1、建立資料表
CREATE TABLE `test_data_quotient_person_info` (
`person_id` varchar(32) DEFAULT NULL COMMENT '人員ID',
`id_card_number` varchar(32) DEFAULT NULL COMMENT '身份證号',
`person_name` varchar(32) DEFAULT NULL COMMENT '姓名',
`person_sex` varchar(32) DEFAULT NULL COMMENT '性别: 1-男 2-女 3-不詳',
`marry_tag` int(10) DEFAULT NULL COMMENT '婚姻标簽:0-未婚 1-已婚',
`children_number_tag` int(10) DEFAULT NULL COMMENT '孩子個數标簽',
`education_tag` int(10) DEFAULT NULL COMMENT '學曆标簽:0-初等學曆 1-中等學曆 2-高等學曆',
`person_age` int(10) DEFAULT NULL COMMENT '年齡',
`parent_number_tag` int(10) DEFAULT NULL COMMENT '父母存活個數标簽'
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
2、配置資料

二、配置dataworks資料同步
1、按照資料源的方式建表,然後選擇對應的同步資訊
2、配置排程
與本文描述内容無關,此處省略
畫像分析 -- 标簽管理
三、雲計算資源
1、配置外部的雲計算資源,類似于“資料內建”中的資料源管理。
2、配置好外部雲計算資源後可以檢視對應的庫表資訊
四、标簽中心
1、建立标簽模型實體
** 關系模型還未體驗 **
2、實體綁定标簽資料表
綁定表的時候需要先”更新緩存表“更新成功後,才能看到新加入的源資料表。![]()
DataQuotient畫像分析産品體驗報告畫像分析體驗總結目标與操作過程
3、選擇綁定表後,先點選主字段,綁定為主标簽,再綁定所有字段
4、我的标簽--快查功能
任務同步成功後,才能使用到畫像分析的雲計算資源分析引擎,對标簽資料進行探查與分析
可靈活的選擇标簽字段,檢視資料,通過圖表(柱狀圖、餅圖、折線圖)展現,資料的聚合(最大、最新、均
值、求和、次數)情況
五、标簽同步
1、配置同步計劃
不能配置已經上線的标簽,标簽需要先下線,才能配置同步
目标雲計算資源需要選擇,mysql;選擇odps,在群體畫像--群體清單中将無法找到雲計算資源
2、同步計劃配置完成後點選啟動,将資料同步到畫像雲計算資源中
3、可在同步任務中檢視同步狀态,和進行重跑操作,以及檢視錯誤日志
六、API服務
與dataworks的資料服務功能類似
畫像分析 -- 群體畫像
七、配置群體
1、建立群體
2、標明實體後可以添加标簽的邏輯
3、目标場景的圈定條件為
一、中低學曆奶爸
性别:男 : 1
孩子個數 : 大于0 : 1-2 或者 >0
學曆: 中、低學曆 : 0-1 或者 <2
二、高年齡奶爸
性别:男 : 1
孩子個數 : 大于0 : 1-2 或者 >0
年齡: 大于30 : >30
4、圈群完成後,可以檢視圈選結果,對結果不滿意可以重新圈定,确認結果後必須釋出群體,才能生效
5、釋出成功後可以在群體清單中看到釋出的群體
6、群體計算,可以将圈定的群體再次通過(交、并、差)的計算釋出成一個全新的群體
使用交集釋出成新的群體“高齡低學曆奶爸”
八、分析
1、群體分析
選擇分析對象(群體)和度量方式,分析次元(每個次元對應一幅圖)後,可展現多種類型(柱狀圖、餅圖、折
線圖、面積圖)的圖形報表
2、對比分析
對比分析:可以選擇兩個群體,按照不同的度量方式,選擇不同的分析次元,展現不同的圖表
相似性分析:可以檢視兩個群體的相似度,以及每個标簽的覆寫人數
九、全流程體驗
源資料中的樣本資料無滿足“單身女強人”标簽的使用者,從源資料中新增一個,然後看出如何同步的畫像分析中
1、配置目标群體
2、源資料中增加一條“單身女強人”使用者
3、執行dataworks同步資料到ODPS中,在運維中心使用重跑排程,重跑成功後日志中顯示的記錄數位101。
4、在同步任務中選擇任務,進行重跑排程,重新更新資料。
5、同步任務執行成功後,即可在群體清單中,單擊指定群體,看到群體的詳情
大環節的操作流程:1、修改源資料;2、執行dataworks重跑排程;3、執行畫像分析同步任務;4、群體 畫像中看結果。