从经验里提炼出标准,是数据分析师的一项重要能力! 标准关乎好坏的判断,也是后续所有分析的基础,标准错,分析方向就会错,进而导致分析结论错,一错到底。因此,如何定义标准,判断分类,也是数据分析师的一项重要能力。
不妨先回忆一下我们在工作中经常碰见的一种场景,业务人员匆匆的来和你说:***模块的***率好低啊,你分析一下原因出在哪儿了?只有单纯的判断/观点,或者只有单纯的数据,我们无法对业务问题作出准确的判断。我们还需要一个标准,一个判断情况好坏的标准。具体到任何一件事情,凡是有关好坏、高低、分类判断的,都涉及标准。
标准无处不在,只是很多时候我们都忽视了他的存在。生活中我们常说“这家外卖好贵啊。”、“这条街道也太长了吧。”、“这栋楼也太高了吧”,那到底什么算“贵”?什么算“长”?什么算“高”呢?我们大多时候并没有去深究,因为:
2. 人们习惯性的把自己的标准当成别人的标准,没有确认;
3. 人们习惯性的默认一些约定成俗的标准,而不去考虑合理性;
但是作为一名与数据打交道的一线从业人员,面对各种各样的数据,我们心中必须得有自己的标准。因为他是后续分析的基础,也是数据分析师必须掌握的一项重要能力。
李笑来说过一句话:审美常常并不需要知道原理,但创造美的人必须有方法论,否则不可能持续创造。领导们可能并不关心标准,可以主观的进行判断,然后交给分析师去验证,但是作为与业务打交道的一线数据分析师,必须得有一套定义标准的方法论,根据标准去监控各类业务指标,从而能够迅速的判断出业务现状的大体情况。
要想找到一个好的标准,首先得明确一个标准包含三样基本特征:评价指标、切分线、分类定义,从这三个基本特征出发可以得到一个好的标准需要同时满足以下三个条件:
1. 指标与问题高度相关:能够切实反应当下业务的真正情况;
2. 切分线简单具体:简单、具体、易执行,如果不具体则形同虚设;
3. 切分后的类型之间差异明显:如果切分后无显著差异,则又回到最初的问题上,怎么准确判断业务情况?
1、梳理问题流程,寻找关键指标
首先得明白你做这个判断标准是为了什么?从目的出发,寻找能够直接反应业务问题的指标。比如说:“产品质量好”,最直接想到的就是“退货率”这个指标,退货率低,说明客户认可我们的产品,质量当然就好了。当然有时候可能需要多个指标来共同反应同一件事情,比如“产品卖得好”,光看销售件数还不够,还得结合产品毛利以及库存,来做综合评价。
2、找简单、易识别的指标制定切分线
切分线的制定直接决定后面的判断分类,切分线如何选择在下文将会详细描述。
3、进行结果对比,调整切分方式
根据选择的指标与切分线,即可对业务现状进行判断,倘若判断结果无法反应业务的真实情况,则需要不断的迭代优化切分方式。
1、一维分类
一维的结果类指标是最容易找标准的,因为一维指标的业务含义很明确,简单、清晰、直观,无需深究复杂的业务流程,难点在于结合实际业务划分切分线,以下列举常见的几种切分方法:
1.1.1、平均法
比如一组销售员的业绩从10w到100w不等,如何判断谁好谁坏呢?平均法则去这一组数的算术平均数作为切分线,低于平均数则“差”,高于平均数则“好”。简单粗暴,但公平、易操作、可解释性强。平均法所反应的业务含义很清晰:
02. 可以推算出接下来的目标或者所需人数。如:每人每月平均能做50w,十人下月的业绩目标是500w;每人每月平均能做50w,所以下个月300w的业绩需要6个人。但是平均法也有他的缺点,即:受极值影响大,因此不适合极值很大的数据,可采用中位数代替。
1.1.2、分摊法
比如本月销售目标1000w,销售队伍10人,所以每人分100w,能达到100w的则“好”,达不到100w的则差。乍一看和平均法很像,但是有一个本质区别,平均法是基于已经发生的现状,而分摊法则是基于任务要求。
1.2.1、二八法
二八法则在大部分行业里都通用,被大多数人所接受,因此可按照二八法则,排序后,选择前20%的最小值作为切分线,简单、清晰、可解释性强。高于该值“好”,低于该值“不好”。
1.2.2、 十分位法
根据数值大小进行排序,将其均匀切分为十段,这样可以看出从高到低各阶层的水平,在结合具体的业务场景选择切分线。
注意:直接用“算排序”的方法来确定切分线一定好吗?不一定!还要结合具体的数值来看,如果数值全都明显都特别低,即使你设20%的划分线,仍然是一个不合格的低标准。
1.3.1、竞品对标法
寻找竞品的相关指标进行对比,超过则“好”,不足就“不好”
1.3.2、自然周期法
主要看同比数据,假设每年都有一个正常走势,则符合正常走势,且比去年表现好则算“好”,比去年表现差则算“不好”。
2.1、何为象限法
很多业务场景一个指标并不能全面的反应业务的情况,因此二维指标也很常见。成对出现的指标,在逻辑上往往存在一定的联系:
01. 串行关系:订单/回款,点击/转化,活跃/付费
02. 并行关系:数量/质量,投入/产出
所谓象限法,就是在一个二维坐标系上画散点图,然后在分别给x轴和y轴画切分线(x轴和y轴的切分线怎么划分可以参考一维分类中提到的方法),将散点划分为到四个模块,最后根据业务场景定义模块所代表的业务含义。 著名的波士顿矩阵就是利用象限法,通过销售增长率和市场占有率将不同的产品划分为四个不同的类别。
1. 当两个指标之间关联度越小时,业务含义越容易解读,适合用象限法进行分类的指标:
(3)、一个问题的两个侧面:活跃/付费,市场增长率/市场份额
2. 并不是任何两个指标都适合用象限法进行分类:
(1)、如果两个指标高度相关,散点图几乎在同一条直线上的话,则画出来的象限图便失去了解读意义;此种情况可直接用其中一个指标进行分类即可
(2)、若两个指标分类后无法结合业务场景解读分类后的意义,做出来的象限图也是无用的;
3、三维指标分类
三维指标有两种常见形态:并列指标与串行指标,不同类型的指标处理费方法如下:
3.1、并列指标:比如考核销售好坏的:销量、销售额、利润
方法一、在给每个指标划好切分线之后,若各指标重要性差异不大时,可直接规定达标次数越多越好。比如:A-F团队,在销量(量)、销售额(收)、利润(利),三个指标上的达标情况如下表所示,可直接根据达标次数进行排名。
方法二、若每个指标重要性差异巨大的时候,要与业务部门商量,对指标进行重要性排序,不达标的一票否决。
3.2、串行指标:比如考核运营好坏的:注册、活跃、转化
串行指标可采用漏斗分析法,通过计算各个层级之间的转化率,可将三维问题压缩为二维问题,进而采用象限法就进行分类。
3.3、RFM模型
但是一说到三维指标分类,大家一定会想到RFM模型,没错,RFM模型就是通过最近一次消费时间、消费频率、消费金额三个指标通过象限法将客户分为8类,针对不同类别的客户开展不同的营运方式。
但三维很少用矩阵法,因为拆的太细,业务部门可能无法执行推进,这样就失去分类的意义。
尽管设立标准有一套独特的方法论,但是最重要的还是要多于业务部门沟通,分类结果首先要获得业务部门的认可,因为数据是为业务服务的,脱离了业务,就算你的标准在怎么好,也无法落地,就失去了分类的意义。
咱们常说的要培养自己的数据敏感度,也需要从设立标准做起,心中没有一杆秤,都不知道什么算好,什么算不好,何谈数据敏感度呢?