《数据掘金 电子商务运营突围》,作者谭磊
《数据掘金》-电子商务运营和数据
《数据掘金》- 我们需要知道的数据分析
《数据掘金》- 我们需要知道的数据挖掘
《数据掘金》- 数据分析和数据挖掘工具的选择
《数据掘金》- 电子商务数据运营
《数据掘金》- 数据运营的方法(上)
《数据掘金》- 数据运营的方法(下)
《数据掘金》- 流量
《数据掘金》- 用户行为分析
《数据掘金》- 挖掘客户价值
《数据掘金》- 后记
EDA与CDA
这两个概念还真是第一次看到,探索式分析和验性分析倒是知道,估计统计学的书上会有,以后得补补。
EDA
Exploratory Data Analysis,探索性数据分析
描述性统计分析,是为了产生一个结论而对数据进行分析的一种方法,侧重于在数据之中发现新的特征CDA
Confirmatory Data Analysis,验证性数据分析
定性数据分析,在已有的假设基础上进行证实或证伪
简单来说,就是如果已经有了一个结论或猜测想要通过数据去验证下,就是CDA,验证性分析;如果就是想看看数据,想从数据中发现点儿什么结论,就是EDA,探索式分析。
倒也不需要纠结于这两种概念,只需要知道这两种分析方式就行了。
电子商务中的三种基础数据
作者把电子商务中的数据,分为三种类型:
数值型数据
就是可加、可减的数值,用户数、成交金额、订单数这种分类型数据
客观存在的枚举值,比如省份:上海、北京,电子产品:手机、电脑、相机性质型数据
这个和分类型数据的区别,就是,上面是通用的定义维度,而这个是自定义的描述信息,我感觉还是有点儿类似的,理解了就好,比如低活跃用户、高活跃用户,低价值、高价值
关于平均数
拿到数据之后,我们会先看看数据的一个概况,最大值,最小值,平均值等等,可以对当前数据有一个基本的理解。
平均值有很多种,算数平均值,几何平均值,加权平均值,中间数,截尾均数
在 不同的场景下,我们要选择不同的统计方式,比如看看有没有极值,这个对平均值有很大的影响。
数据规范化方法
作者还讲了数据集成、数据清洗的一些内容,就略过了,来看看这个数据规范化。
关于数据标准化,之前的一篇文章:
网站日志
作者也详细介绍了日志的内容,主要是服务器端日志,日志的格式,实例,这部分我没有仔细看,略过。
当然,日志数据是很重要的, 尤其是用户行为的分析。
数据图表
字不如表,表不如图,关于图表,作者只是一笔带过,参考之前的一些文章: