这一步非常非常重要。用户细分可以有无穷无尽的分法,如果不事先定义清楚什么是“有效”细分,就会陷入茫茫多的细节大海捞针。
很多新手最容易忽略这一点,提起用户细分,就急匆匆把一堆用户特征变量塞进聚类模型,聚完了以后不知所措,到处问:“有没有用户分类的科学、权威、谁挑战就拖出去重打50大板的标准?”最后还被运营批判为:做的啥玩意!就是因为脱离了业务实际,只埋头加减乘除的缘故。
有效的分类标准,当然是根据运营的需要来的。我们可以从运营的目标、KPI、任务里拆解出对应的数据指标,比如运营的任务是:提升收入。我们按以下步骤,把业务问题转化为分析问题。
有了分类标准,就能检查细分是否有效,比如目标是:找到累积消费高的用户群体。那最后就看,我们找到的细分群体,消费差异是不是足够高,是不是真的锁定了高消费群体。
具体效果如下图所示:
找到了分类标准,我们可以看从什么维度切分用户,能让用户群体间差异更明显。这里又是一个大坑,因为看起来似乎可选维度非常非常多。很多同学陷入迷茫,到底我该怎么选。或者好不容易选出来,运营问:为什么这么分?他答:这么分差异大!然后被批判为:不懂业务,瞎胡乱做,好郁闷……
实际上,分类维度筛选有一定标准,完全不用到处乱跑:
(1)选数据来源可靠的维度
比如性别,年龄这些基础维度,很多公司没有严格采集流程,数据空缺多,真实性难保证,就不要用这些。尽量用消费、活跃、注册来源这些可靠的数据。
(2)选运营可影响的维度
比如设备型号,可能开发很关心,但运营知道了也干不了啥事,这时候就不要选;有些指标运营特别关注,比如运营想发优惠券,那用户对优惠券领取率、使用率就是特别好的指标。
(3)选自身分层差异明显的指标
有些指标自身差异都不大,数据分布很集中,这时候就不优先选用,优先选择那些自身分布差异大一些的指标。
以上,基于这三个标准,可以避免大海捞针瞎做实验,也能避免做出来被运营批判为:“这有啥用”。有同学会觉得,这个过程和做风控模型时找特征很像。确实很像,但有区别。风控模型对应的业务动作只有“通过/拒绝”两类,所以完全不需要考虑那么多。而做给运营的用户细分,运营落地时要考虑:活动主题、时间、产品、卖点、传播渠道……一大堆玩意,所以必须考虑哪些维度对运营有用。
这里又有三个很纠结的问题:
先从结果来说:原则上,最终分类数量不宜太多,每个群体要在运营看来有可操作意义。运营做活动要设计海报、备货、开发系统、准备投放资源。因此如果群体规模太小,是不适合单独做活动的。所以做用户细分时,习惯上限制群体最大为8类(每个群体都大于10%的份额)至于具体规模大小,可以根据项目目标,运营情况做设计。
在这个大原则下,意味着分类维度和每个维度的切分都不可能太多,尽量选关键维度,关键切分点,如果维度太多可以考虑用降维算法来做压缩。在每个维度切分时,需注意以下问题:如果单维度分段,发现某些分段有特殊性,就不能随意合并(如下图所示)
总之分类的过程需要反复尝试很多步,直到最后输出理想结果为止。