天天看点

客户数据平台(CDP)建设避“坑”指南

作者:SCRM笔记
客户数据平台(CDP)建设避“坑”指南

一个CDP产品做下来,发现不少容易踩的坑。总结一下,大家一起提高。

一产品定位

CDP定位是给营销人员使用,主要目的是精细化客户画像和细分客群圈选,进行个性化营销。

此外,CDP还有另外两个重要应用:360度客户视图、为营销工具如MA(营销自动化)提供圈选的人群。

360客户视图的使用场景,除了让营销销售人员在与客户互动时,能够对客户有全面的了解。

此外,企业里所有有机会接触客户的岗位人员都应该能够查看客户的360视图,比如前台、客服、经理等,市场或客服人员还按负责不同渠道进行区分如点评、头条、微信以及纸媒广告等。

无论什么岗位的员工在什么渠道接触客户和与客户互动,他们看到客户信息是一致的(也称单一客户视图),从而能够为客户提供一致的体验,比如,客户咨询产品或投诉问题,在转交不同的人处理时,他不需要反复重复自己的问题,员工也能快速了解客户的问题和处理的进度。

自动化工具允许为不同的圈选人群制定不同的营销和服务策略,优化客户购买旅程,提升客户体验。

360客户视图的使用者从营销人员扩大到现场服务人员和客服人员后,就对360视图数据的实时性提出了要求。试想一下,客户已经到店了,或者客户正在投诉,接待人员还看不到客户投诉的消费数据,危机应对和客户体验都会大打折扣。

在MA的场景,对数据的实时性也有较高的要求。对于向指定圈选人群进行群发的活动,一般T+1就可以满足。但在活动达标和实时推荐场景,需要秒级实时性。比如,客户已经消费了4000元,再消费1000元就可以参与抽奖,客户在支付1000元后,抽奖按钮应该点亮。或者客户在网站浏览了文章和商品后,跳转页面时,可以优先展示客户感兴趣的内容和商品。

二数据质量

数据质量是数据产品的生命线,一开始就要要求数据架构面向质量设计、确定质量标准、确定质量管理流程和责任人。

1、面向数据质量设计

CDP数据要求和数据源高度保持一致。设计时CDP时利用好企业的主数据,使得CDP的数据质量得到保证,至少企业的不同数据产品的数据一致性得到了保证。

业务部门和IT部门共同努力确保了企业官方共享主数据的高质量。

2、确定数据质量标准

明确如何衡量数据集的完整性、唯一性、有效性、一致性、准确性和及时性,确定衡量指标,以及如何获取数据计算这些指标,监控指标的变化。

3、数据质量管理流程

确定数据质量管理的责任人,包括不同数据域的数据所有者、数据管理员、数据用户,明确职责和权利。

明确数据质量周期,固定分析数据、清理数据、监控数据质量的多个迭代周期。

三数据模型

CDP是使用标准模型还是自定义模型?相信很多人有困扰。做过数据仓库或BI的人,认为CDP也必须有标准数据模型。我们来看下市面上主流CDP的做法:

1、salesforce:

提供了一套标准数据模型对象(standard data model object),也支持完全定制数据模型对象,或者混合使用标准和自定义的数据模型对象。

2、segment:

系统做好与主流系统的数据对接,如salesforce、hubspot、Shopify等,用户只要选择数据源,并登记自己的数据源系统账号,即可同步数据;数据同步过来后,直接按系统预设好的表结构存储。

如果选择自定义的数据源,也可以映射到目标数据库表存储。

3、火山CDP:

数据源接入:可以自定义接入的数据源,这意味着不同数据源的表结构完全不同。

可视化建模:接入的数据源中不是所有数据表直接可以用作CDP的数据集,创建CDP可用的数据集就是建模,可视化建模支持多表关联形成数据集模型,再通过元数据配置成CDP上层应用可使用的数据集。

ID mapping:自定义身份匹配规则,将拥有不同身份的客户进行合并,共用一个ONEID;也可能由于身份冲突,根据规则,该身份合并到另一个ONEID。

四数据采集

客户事件上报会遇到一种复杂场景,如提交订单事件,订单包含多个商品,有几种上报事件的方式:

1、上报一次事件,订单商品不上报,或者将商品名称按逗号分割拼在一个字符型属性里。

2、上报一次事件,商品信息上报到一个list类型的属性里,list里包含多个商品信息。

3、每个商品上报一次事件,一次上报只包含一个商品信息。

五ONE ID

ONEID的主要任务是识别同一个客户的不同身份,打通客户数据,丰富客户画像,形成360度客户视图。

在设计客户身份ID mapping机制时,考虑每种身份的优先级、同一种身份下最多可以有几个id(强身份如customerId要求唯一性)。

保持客户身份的纯洁和ID mapping的清晰至关重要。用户容易理解,处理逻辑清晰,系统稳定可靠可预测。

在有些场景,会绕过ID mapping直接将两个身份绑定并识别为同一个客户,这种方式导致系统没有打通身份的依据,mapping关系不稳定,导致ONEID不稳定,应避免。

六元数据管理

元数据是描述数据的数据。如何定义元数据,决定了CDP的数据如何被管理和应用。

元数据是CDP的基础,一开始就要规划设计好,否则返工的代价很大。

1、元数据在CDP上层应用和底层数据集之间架起了桥梁。

元数据对每一个数据集及数据字段进行描述,包括客户资料、客户事件、业务明细单据等。

数据集:描述数据集映射的数据源表,一般一个数据集映射到一张表或一个视图,也可以是一个select语句。添加了新的数据源后,只要添加对应的元数据来描述该数据源的数据集,即可使用。

数据字段:描述映射的数据源表的字段、字段类型、显示名称、操作符、下拉选择框里的候选值及来源、排序、输入提示、字段业务含义的提示、应用场景等等。

2、事件属性元数据。

由于事件数据是在宽表存储的,每个事件属性会占一列,很容易导致宽表列膨胀。

属性元数据统一管理事件属性,相同的事件属性共用一个属性元数据,占用事件宽表的一列。

七客户细分

1、明细数据筛选

明细数据指一个数据集中,一个客户可以有多条记录,比如订单明细数据。(相对于明细数据,如客户资料, 在一个数据集中一个客户只有一条记录)。

从明细数据筛选客户的时候,注意两种查询sql写法差异。以订单明细数据为例,要筛选近180天购买了A商品的客户:

(1)两个筛选条件做并集:近180天有购买订单的客户 和购买过A商品的客户

(2)一个筛选条件:购买时间在近180天且在这180内购买过A商品的客户

显然,方案(2)才能筛选出正确的结果。

对于所有的数据集,都可以按方案2的思路设计前端交互,并决定后端如何组装sql,准确完成客户筛选。

2、做过/未做过

有助于明确筛选范围,是筛选已经做过某些行为客户,还是筛选没有做过某些行为的客户。

1)做过:指定筛选范围在已经发生的事件中筛选。

2)未做过:指定筛选范围时排除已发生该事件的人群,或者说是全量客户排除已发生该事件的客户。不如,筛选“未做过”最近30天消费过某商品的客户,算法是从全量客户中排除最近30天消费过某商品的客户。

客户数据平台(CDP)建设避“坑”指南

3、统计指标

统计指标是对明细类数据集进行统计查询的。一般包括以下几种算子:

1)总次数(count)

2)总和(sum)

3)均值(average)

4)最大值(max)

5)最小值(min)

4、反向选择

所谓反向选择是指,选对一个客户范围,从全量客户排除这一部分客户后的客户。

比如,查询性别不等于女的客户,就包含了性别为男、未知、性别字段为空的客户,实际查询是,用全量客户排除掉性别为女的客户。

在筛选目标人群时,除了“且”、“或”算子外,可增加“排除”算子,从全量或已圈选的部分人群中排除出指定人群,达到精细圈人的效果。

客户数据平台(CDP)建设避“坑”指南

八小结

这些坑其实都是CDP建设中的难点也是重点。解决了这些问题,少走很多弯路,不仅能节约建设成本,也能加快建设速度,使产品早日投放市场。

继续阅读