1 / 基础设施
数据是基础设施,是运营和产品分析优化迭代的基础,要主动为运营或产品的实现过程埋数据检测点,数据检测点越多,剖析得到的信息就越多,对于内部运营机制的理解就越多。
2 / 信息
数据和信息并不等价,看到数据解析出其代表的意义,数据这才转换成信息,数据方才产生价值。
3 / 预测
数据能窥探未来的趋势吗?如果可以,这要有一个很大的前提,数据累积的历史环境和目前环境并没有多少差异。但是这里存在一个很有意思的地方,人也是环境的一部分,人了解了历史数据,人的认知发生了改变,环境也就发生了变化。
这有点像一致趴在镜子前面适应环境的变色龙,你说最后变色龙会处在哪一种状态呢。我成为了环境的一部分,而我想要从环境中得到改变,我变了,环境就变了,均衡点会落在哪里呢。
4 / 黑天鹅
数据代表了过去已经发生事情,如果某件事在可知的历史内没有发生过,我们无法预测他是否会出现,甚至都不知道他的存在。
存在这样一种情况,我们所获取的数据都是一定时间一定范围内的白天鹅,我们从白天鹅的存在无法推测出黑天鹅是否存在,除非我们真的见到过一只黑天鹅。
5 / 相关关系
大数据能很容易找出相关关系,证明因果关系却很难,我们能找到啤酒和尿布销量的相关关系,而这种相关关系发生的条件很脆弱,适用范围也很有限,找到相关关系这层表现背后的因果,就可以把变化的环境当成变量纳入逻辑进行推理证明。
6 / 幸存者偏差
幸存者偏差就是“没来的请举下手”,失败者带着他们的数据一起消失,我们能得到数据的来源有可能只是那些能发声的幸存者。
7 / 异常
在某一范围内某些异常随机数据,放在更大尺度内,或许就呈现出某种规律出来。