刚看完了《大数据时代》,按照我一贯读以致用的看法,读了一本书之后应该尝试用几句话高度概括一下,在以后需要用到的场合往往只要看这几句话就够了。
这本书读完之后我概括起来就是以下几句话:
1,所谓大数据,不仅仅是指数据的量,更指数据的全面性。
2,对大数据的分析要效率不要绝对精确,要相关性而不要因果关系
3,大数据时代的大幕才刚刚拉起,数据算法师在未来是非常重要的一个角色
4,数据是一种资产,以后会有很多从事数据交易的中间商出现
5,人类不能过于依赖数据去做决策,自由选择的权力绝不能放弃
1,所谓大数据,不仅仅是指数据的量,更指数据的全面性。
很长时间以来,我一直以为大数据的大就是海量的意思,只有非常多的数据才能称之为大数据。
这本书提出了一个新颖的观点是,大数据的大不仅仅指数据的量,更指数据的全面性。
以往由于计算能力的欠缺,存储成本高昂,很多时候做科学研究或人口调查时,基本上不会使用全部的数据,而是采用抽样统计,再基于抽样统计的结果对整体进行评估。
这种传统的抽样统计的方式在大数据时代可以抛弃,随着计算能力的突飞猛进和存储成本的急剧下降,已经可以实现对所有数据的分析。
2,对大数据的分析要效率不要绝对精确,要相关性而不要因果关系
现实中采集的数据很多时候是零散的,没有明确的相关性,基于这种大规模数据的分析,要想做到绝对精确是不可能的。按照作者的观点,大数据处理的目的主要是能用,很多时候基于数据分析的结果并不会符合常规的推理分析,不会有明确的因果关系,只要知道“是什么”,没有必要知道“为什么”。
3,大数据时代的大幕才刚刚拉起,数据算法师在未来是非常重要的一个角色
最近我一直在考虑一个问题,很多时候我们说某些牛逼的人特别有长远的眼光(当然这种话都是事后诸葛亮),这种长远的眼光,本质上就是对未来趋势的预判和把握。
目前刚刚开启的大数据时代的大幕,就是我们这一代人面对的一个趋势,无论是在读书的年轻人,还是职场人士,我们都要直面这个趋势。
顺势而为,方能顺势而上!
4,数据是一种资产,以后会有很多从事数据交易的中间商出现
数据一定是一种资产,这个观点有些人已经认同,也有些人还没有引起重视。常见的一个观点是,如果数据都是匿名的,这样的数据是没有价值的。
作者在书中举了好几个例子反驳了这种观点,即使一类数据是匿名的,另一类数据也是匿名的,但当这样看似无关的数据非常多的时候,数据分析师照样可以提取出有价值的信息。
关于数据的价值,我们应该树立的另一个观点是不能仅仅看数据本身首次提取的价值,数据的价值可以被多次体现,虽然在现实中很难准确的量化这种多次提取的价值,但这种思维我们一定要具备。
5,人类不能过于依赖数据去做决策,自由选择的权力绝不能放弃
作者在最后讨论了人类的未来和数据的关系,包括个人隐私的问题。作者认为,即使数据分析的结果是准确的,我们也不能放弃个人自由选择的权利和社会伦理。
作者举了一个案例,比如警察通过海量监控数据的分析,发现住在某个街区的一个家庭可能发生男主人攻击妻子的行为,于是为了防止这种惨剧的发生,警方快速上门逮捕了男主人。
但是,一个人只是有潜在的犯罪概率,并没有真正实施,这样的逮捕就是违法的,纵使数据分析的结果千真万确。
关于这一点,我想到最近看到的另一篇文章,百万畅销书《人类简史》的作者9月份又推出了一本新书《未来简史》,其核心思想就是人类的一切都是数据,数据主义至上,人类在未来的判断要让位于数据,甚至包括和谁结婚更合适这样的事都应该让机器去判断。
这个观点其实和《大数据时代》是相悖的,我个人也倾向于认同《大数据时代》的观点,人类的未来不可能也不应该完全让位于机器和大数据分析。如果我们创造了一个云端的超级大脑,它不仅能知我们的过去和现在,更能预知我们的未来,我觉得这样的超级大脑就是上帝,人类自己创造的上帝。
能预知未来的不是上帝还会是什么?!
如果真的创造了这样的超级大脑,也许就是人类悲剧的开始。