《数据的本质》,作者:车品觉
这本书买了好久好久,之前应该是看过一遍的,这其实是一本拓展思路的书,更多的是作者关于数据的思考,这里重读下,顺便写写读书笔记。
书中有一个观点“未来人人都是数据分析师”,这个我是很赞同的,之前也就说过,数据分析是一种能力,是人人都需要掌握的技能就像IT技能一样,在初期,可能只有一拨人了解计算机,了解电脑,其他人一方面接触不到,一方面不得要领,随着时代发展,现在人人都了解电脑,什么硬件软件,很多人都可以是说出一些心得。数据分析也是一样,现在看似有一波人“数据分析师”在专门做这些事情,但是以后随着岗位技能的要求提高,一定会是人人都是数据分析师,当然不需要掌握太深,基本的知识,基本的能力还是要具备的。
无处不在的数据
随着互联网的发展,移动互联网的发展,智能设备的发展,我们可以获取的数据越来越多,目前来说,我们就可以获取出行数据,是公共出行,打车,专车,从哪儿上车,从哪儿下车;外卖数据,我们平时几点吃饭,喜欢吃什么,川菜?鲁菜?通过智能手环,现在还可以获取用户睡眠情况,几点入睡,几点醒来,深度睡眠多久,浅度睡眠多久,最近几个月的睡眠质量如何。
(等等,如果黑客可以侵入手环,知道了用户什么时候睡觉,岂不是很危险??)
总有一天,我们将可以获取用户一整天的数据,生活的一切都将数据化,几点起床,洗脸多久,刷牙多久,花了多久吃早饭,吃的是什么,有多少卡路里,使用了多少水,几点出门,走了多少步,距离多少.......未来可期,当所有的数据都放在我们面前的时候,除了兴奋,还有些恐惧,数据安全怎么办?我的隐私怎么办?
@@数据的价值必须来自场景
场景是很重要的,数据离开了这个场景,可能意义就不是很大了,线上线下场景的不断融合,会催生出来一些新的模式,产生新的数据。
数据相关性比数据本身更重要
这一节我只对两个点比较感兴趣,一个是数据需求,一个是作者讲一个一个量化一切的故事。
在产品设计阶段,我们一般都会有产品需求文档,现在我们需要加入DRD(data requirement document)数据需求,这样我们可以在业务过程中收集数据、分类数据、整合数据。
“量化一切”,作者讲了个例子,我觉得很有意思,是说他临时去参加一个会议,又临时被要求给大家做一个演讲,作者也慌,不知道讲什么,他就根据上午的会议量化了各个集团CEO关注的话题点,怎么量化呢?观察每个CEO对上午演讲题目的关注度,主要通过行为,像点头的动作,写笔记和发问,知道每个CEO关注的点,下午作者再去演讲,就都是CEO想要听,想要了解的内容了。
数据流动在于利益关系
作者在这里讲了阿里数据打通的问题,像阿里这样的大公司,打通数据都这么难,更别谈其他公司了,公司内部数据流通,行业数据流通,这都是未来需要做的,数据打通共享后,获得的效益一定更高。
这里有个词“数据断裂(Data broken)”,就是说数据不能反映当前的事实,这是由于数据更新导致的,之前我们公司在初期快速迭代的时候,就出现过,各个业务开发团队独立进行,我们这周刚梳理出来的模型,下周开发团队就迭代掉了,而我们还不知道,这就是“数据断裂”。
在怎样打通数据上,作者也提出了自己的一些建议,这里结合了他在阿里的经验,比如:找到大家都在用的基础数据,被野蛮复制的数据,抽出来做标准化,作为公共数据,并且开发一些常用模型,让大家知道打通后的便利性;还有一点就是找到大家都有的痛点。
@@数据分析的工作最终必须落地在产品上
这个观点我也比较认同,数据分析很多内容都是可以固化重用的,不必每次都重新来过,分析的可以是针对某一类问题,而且变成产品,业务团队可以自行分析,解决问题,从侧面释放了分析师的一部分工作。
伦理,大数据的关键破绽
这一节作者主要讨论了数据安全,数据伦理问题。
数据流通过程中,如何保障个人、企业和公众的应有利益?这其实需要的实践当中不断的摸索去完善,并且依靠每个个体的自我约束。
对于人工智能的发展,伦理问题该如何解决,机器人是否真的会觉醒?如何监控这一切,这其实都需要在不断的实践当中,不断的总结完善,目前看来,并没有真正的答案,我们要带着一颗敬畏的心,勇敢的前进。
数字经济引擎
数字化引擎包含4种形态:
- 数据驱动决策
- 数据驱动流程
- 数据驱动产品
- 数据驱动数据
这一节,作者更多的谈到企业数据化的一些点,“@@未来没有一家公司,不是数据公司”,具备数据化思维是非常重要的。
作者谈到了数据与商业的结合,介绍了他在阿里的实践经验,上面这张图我觉得非常好,现在很多公司都重视数据,想要做数据化运营,精细化运营,上一半大家都考虑到了,但是能做到下一半“运营数据”的少之又少。
数据资产
这几节作者在说明数据作为一种企业资产的重要性。
@@数据的存在是为了能够有效地解决问题,而解决问题的核心与关键还是在于预测。
数据变现四大场景
这一节,主要说数据的应用场景,作者举了很多的例子,像医疗行业,金融行业,无人汽车,智能设备等等,这里不展开了,可以看看书,拓展一下思路。
@@标注的内容表示引用书中的话