一、序言
能感觉到,部门是有较强的数据意识的,例如,大家经常会把这句话挂在嘴边:“先盘一下数据吧!”。这个意识非常珍贵。但同时,我近期也觉察到两个现象:一是大家有时候希望拿起数据这把枪的时候,却发现不知道怎么瞄准;二是虽然会用,但是磕磕巴巴,打一枪之前得调来调去好半天才能开枪,非常不畅快。其实数据分析工作是有一些方法论可以帮到大家的,这篇文章就想讲讲这个主题。
二、数据分析工作的几个较独立模块
数据分析在实际操作中有几个相对比较独立的模块:界定问题、选择指标、梳理逻辑、表达结论。
对于专职数据分析人员来说,大多数时候都会从界定问题一直盯下来,完成最终的结论表达;当然也有的时候由于工作时间所限,或能力经验所限,只负责了其中部分环节。对于非专业数据分析人员来说,更多会在界定问题和梳理逻辑这两个点上多参与一些。
三、界定问题
3.1 界定问题要准确
要保证自己想了解的东西可以拆成具体的子问题,并可以落实到指标上、系统页面上、业务中。
举例:我想看一下移动端资源的赠送情况。
剖析:
怎么拆子问题?可以从这两个角度去谈这个“赠送情况”:
1)公司赠版资源里,有多少是移动的,有多少不是移动的?
2)移动上线的资源里,有多少是签的购买合同,有多少签的是赠送合同?
这样是不是清晰多了?然并卵,后面的指标、系统、业务方认可一个不满足,都会让整个分析铩羽而归。
真正的合同是怎么签订的呢?去对应的系统,打开一个合同,很容易就可以看到:哦,原来是合同分为购买部分和赠送部分,各自有各自的刊例价,然后有一个整体的销售金额,用销售金额/(购买刊例+赠送刊例),就知道了整单折扣。合同里会有每条资源的排期,刊例,和销售金额。每条资源的销售金额是用刊例*整单折扣这么算出来的。系统很给力,有一个标签“购买类型”可以看出是买的还是赠的。那么用刊例金额还是销售金额来表示“资源”的概念呢?由于刊例价是未脱水的资源价值代表,而销售金额是用整单折扣去折算的资源价值代表,选择哪个指标都不完美。这个时候就该去找业务商量啦!
真正的数据统计和分析,需要在这一系列问题都解决之后才能真正开始。
3.2 界定问题要开放心态
不能用已有的经验束缚自己去了解事实的真相。
举例:业务方提出,“要看一下资源点位释放的情况”
剖析;
正巧之前的一个项目,跟合同部打交道比较多,我知道合同部定期会统计“合同提前终止类变更导致多少收入损失”,所以就想当然了一下,找研发问有没有正式合同的点位释放记录。研发答复:正式合同的有,但是不好取;预定合同的没有。幸亏研发同学回答的全面,我多想了一下,又电话跟业务方沟通确认,才明白人家要的还恰恰就是预定合同的点位释放记录。不同的排期预定系统主干逻辑类似,但细节千差万别,所谓每个系统都有它的脾气,以前经手的系统不存在的问题,可能就在拐角处等着你呢!
四、选择指标要考虑全面、深入
举例:老板希望知道“每个用户给公司带来多少价值”,并且要求,把产品和销售的贡献拆一下
剖析:
价值就是钱,可以用刊例,可以用销售金额,这个简单。
怎么把产品和销售的贡献拆开呢?是不是刊例代表产品的贡献,销售金额代表销售的贡献?
这里就有一个稍微有点深的问题,容易想不到:没有卖掉的产品,算不算产品的贡献?其实应该算的,只要是设计、开发完毕的产品,也就是有刊例价的产品,理论上来说都应该算产品的贡献。因此用刊例来代表产品方没问题,但思考完,就知道刊例也分可售刊例和售出刊例,而前者才是更加全面考虑后的选择。
五、梳理逻辑常用的五种方法
5.1 因果拆分
因果拆分可以简单理解为乘法。比如收入下降了,可以看看收入=客户数*户均,是哪个因素导致的。
5.2 结构拆分
结构拆分可以理解为加法。同样,比如收入下降了,可以看看收入=A部门+B部门,是哪个部门导致的。一般来说,由于某组成部分导致的整体数据变化,最终也会反应在因果拆分时,因此建议先用因果拆分。
5.3 因果、结构组合
有时需要先按因果拆分后,再去把出问题的因素按结构拆分一下。比如客户数掉了,看看主要掉在哪个部门头上。复杂的时候,会组合2、3轮。
5.4 重要性排序
业务总是繁琐的,很多因素共同导致了当前的数据结果。用前面集中方法拆分后,可能会有多个答案,这个时候要思考一下哪个是主要矛盾要强调,哪个是次要矛盾,知道即可不用多说。
5.5 对比分析(用于排查异常数据时)
简单的说,有多少种对比的维度,就有多少种排查的思路。
举例:业务方反馈,某广告位上海地区的点击数据异常。
剖析:
有很多种方式去对比,来定位异常原因:同广告位前一个月表现怎么样(时间维度),同页面其他广告位表现怎么样(页面维度),同广告位其他地区表现怎么样(地域维度),同广告位分时表现怎么样(时间细分)。这么一对比,基本上很快就能定位到原因了。
六、表达结论要简短清晰、重点突出
数据分析工作和其他所有工作一样,一点点真知灼见都隐藏在大量繁琐的细节工作中。但是,同其他所有工作一样,让自己的工作价值凸显的最好方法,恰恰是不提繁琐,不提细节,让自己的深入思考通过简短的文字体现价值。
一个数十万的大表,经过各种人工处理、拼表、透视,最终可能只说明了一句话,那么就把这句话说出来,这个大表就存档防调用好了。一定要学会把数据转换成文字、转换成自己的经验,否则很快脑子的内存就满了。
七、业务共识
界定问题、选择指标、梳理逻辑、表达结论,数据分析的每个环节,都是为了业务方服务的;每个环节都有可能引起业务方的不理解,处理不当就会爆炸。个人经验是,一头一尾一定要处理好,充分共识后再开始分析和结束分析。
八、写在最后,自勉,共勉
相对于闪闪发光的产品经理,数据分析师的工作存在感没有那么强,阅历不够的年轻人经常被这几句话噎的心塞好几天:
你这数据不对啊!
业务不是这样的!
赶紧帮我弄个数!
但是,跟其他所有的工作一样,总是有办法可以提升自己
8.1 要自己思考工作主线
想清楚自己想研究什么,然后设立目标,拆分工作,逐步推进。没有主线,自己都不知道自己在忙什么,就非常容易被外部需求牵着走了。
如果不知道自己想研究什么(这是非常可能的,不要怕说出来),还有一个小小的方法论:问问自己,一年内团队最重要的事是什么?3个月内团队最重要的事是什么?自己能服务什么?然后定一个方向,开始起步。
8.2 开放心态
数据确实不如产品更接近业务;产品确实不如销售更接近业务。所以不要在数据里故步自封,走出去,投入业务的洪流。
8.3 学会抽象
从一个大表里抽象出一句结论;为每一页ppt抽象出一个标题;从日常工作中抽象出一个理念。只有抽象,才是摆脱日常繁杂事物,进行理性思考的开始。