思考:
数据分析方法的三大作用?
主要是现状分析,原因分析,预测分析
基于分析的目的对应的数据分析方法
基于上图显示的分析方法,进行一次介绍说明
一、现状分析
1. 对比分析
定义:对比分析,顾名思义,是指将两个或者两个以上的数据进行比较,分析差异性,从而揭晓事物的性质、变化、发展、与其他事物的异同等个性特征,从而更深刻的认识事物的本质和规律
指标和维度:
1. 指标,也可称之为度量,是用来衡量事物发展程度的单位或方法,需要通过计数,加和,平均等汇总计算方式得到,同时汇总计算需要在一定前提条件下进行,这个一定前提条件是统计口径与范围,比如时间、地点、范围。
分析一个事物的发展可以从数量 Quantity 和质量 Quality 这两个方面进行对比分析,简称QQ模型,为对比分析提供思路。
质量可以分为广度和深度
广度:群体覆盖的范围
深度:群体参与的深度
应用
分析业务,先分析业务是否达到一定的规模。如果业务的规模足够大,可以再分析质量高不高。收入与利润率,用户数和留存率等组合分析都是QQ模型的经典应用。
2. 维度
指标用于衡量事物的发展程度,那这个程度是好是坏,需要通过不同维度进行对比,才能判断出是好是坏。单独的数据呈现结果并不能说明问题。维度是事物或现象的某种特征,即分析角度,熟悉的🌰有:产品类型、用户类型、地区、时间等。
a. 同级别对比,横比。了解自身某一方面或其他各方面的发展水平在公司、集团内部或各地区处于什么样的位置,哪些指标是领先的,哪些是落后的,进而找到方向和目标。看自己,看同行,看市场——看差异
b. 不同时期对比,纵比。时间是一种常用的,特殊的维度,之前提到的同比和环比在这里就应用到了——看变化
比较之前,都有了解选取的对比对象是否有对比意义
c. 与目标对比——看差距
强调:只有通过食物发展的数量、质量两大方面的指标,从横比、纵比角度进行全方位的对比,才能够全面了解事物发展的情况与规律
2. 分组分析法
分组分析法,是根据分组字段,将分析对象划分成不同的部分,以对比分析各组之间的差异的一种分析方法。
定性分组 & 定量分组
定性分组:按实物的固有属性划分,如性别、学历,地区等属性,定性分组一般看结构,即结构分析
定量分组:数值分组,根据分析目的将数值型数据进行等距或非等距分组,定量分组一般看分布,即分布分析
3. 结构分析法
定义:结构分析法,实在分组的基础上,计算各组成部分所占的比重,进而分析总体的内部构成特征
常见应用:市场占有率,用户性别结构,用户的地区结构,公司的产品结构等
结构相对指标(比例)=(总体某部分的数值/总体总量)*100
4. 分布分析法
定义:分布分析法,是根据分析目的,将数值型数据进行等距或不等距分组,研究各组分布规律的一种分析方法
常见应用:用户消费分布,用户收入分布,用户年龄分布等
5. 交叉分析法
定义:交叉分析法通常用于分析两个或两个以上分组变量之间的关系,以交叉表的方式进行变量关系的对比分析。交叉分析的原理,就是从数据的不同维度,综合进行分组细分,以进一步了解数据的结够、分布特征。建议分析维度不超过 2个,越多越抓不到重点。交叉分析更像是一种展示数据的技巧。
6. RFM分析法
使用此分析方法需要满足以下 3点假设:
1. 假设最近有过交易行为的客户,在此发生交易的可能性要高于最近没有交易行为的客户
2. 假设交易频率较高的客户比交易频率低的客户,更有可能在此发生交易行为
3. 假设过去所有交易金额较多的客户,比交易总金额较少的客户,更有消费积极性
实现方式有两种
方法一
使用Excel相关函数将R、F、M三个值根据相应的标准划分为高、低两类,再使用交叉表分析将R、F、M分类结果交叉组合为八个客户群体
方法二
计算RFM分值,文本转数值型数据,有点像编码
step1:
R_S 定义为距离当前日期越近,得分越高,最高分 5分,最低分 1分
F_S 定义为交易频率越高,得分越高,最高分 5分,最低分 1分
M_S 定义为交易金额越高,得分越高,最高分 5分,最低分 1分
step2:
RFM=100*R_S+10*F_S+1*M_S
step3:
根据细分模型,将用户划分八种不同类型
系数设定是为了使得使得RFM值的顺序和RFM客户细分模型的分类顺序保持一致
7. 矩阵关联分析法
定义:将事物的两个重要属性(指标)作为分析的依据,进行关联分析,找出解决问题的一种分析方法,也成为矩阵关联分析,简称矩阵分析法。
矩阵图的关键在于找到两个度量(相关)以及划分象限的方法。矩阵关联分析法非常直观清晰,用法简便,在营销管理活动中应用广泛,对销售管理起到指导、促进、提高的作用,而且在战略定位、市场定位、用户细分、满意度研究方面都有较多的应用。图形表示可以通过散点图展示,进阶图形为气泡图,新增加一个属性,数据图下章详细学习。
(联想一下事件的优先级,紧急优先级高,紧急优先级低,不紧急优先级高,不紧急优先级低)
8. 综合评价分析法
定义:通过对实践活动的总结,逐步形成了一系列运用多个指标对多个参评单位进行评价的方法,称为多变量综合评价分析方法,他的基本思想在于将多指标转化为一个能够反映综合情况的指标来进行分析评价。
综合评价分析方法主要有 5步:
step1:确定综合评价指标体系,即包含哪些指标,是综合评价的基础和依据
step2:收集数据,并对不同剂量单位的指标数据进行标准化处理
step3:确定指标体系中各指标的权重以保证评价的科学性
step4:对经处理后的指标在进行汇总,计算出综合评价指数或综合评价分值
step5:根据评价指数或分值对参评单位进行排序,并由此得出结论
二、原因分析
9. 结构分解法
经典好用的逻辑树——用来做对比分析,它将问题按项目组成结构进行分层罗列,层层深入,分析项目构成的变化,直至找到问题所在。是因素分解法的特例
10. 因素分解法
定义:因素分解法把综合性指标分解为各个原始因素,主要用于有明确分析梳理关联关系的各因素直接的变动对综合指标变动量的影响程度,从而确定指标变化的原因。
因素分析法的具体操作步骤:
a. 确定指标因素有哪些
b. 确定各因素与指标的关系,如加、减、乘、除或函数等
c. 测定、分析因素对指标变动的影响方向和程度
11. 漏斗图分析法
漏斗图是一个适合业务流程比较规范、周期比较长、各流程环节涉及复杂业务过程比较多的管理分析工具。用户使用行为分析就可以通过漏斗图进行分析。单一的漏斗图无法评价网站某个关键流程中个步骤转化率的高低,但是可以通过对比方法,对同一环节优化前后效果进行对比分析,或对统一环节不同细分用户群转化率做比较,或对同行业类似产品的转化率进行对比。对比真是有效的方式。此外,通过对不同业务的漏斗图进行对比,可以找出何种业务在网站中更受用户的欢迎或更吸引用户。
三、预测分析
12. 趋势分析方法
预测分析常用的方法可以分为定性预测与定量预测两大类。
进行预测,重点不在于使用多么高级的预测分析方法,而是在于是否服务业务的实际发展情况
除此之外,还有很多高级数据分析方法,不断熏耳,培养自己的业务嗅觉
总结
介绍了很多基础的数据分析方法,大多数都是用于原因和现状分析,可以通过网上搜索一些数据分析的案例,加深印象,温故知新。