《大数据时代》是浙江人民出版社于2013年1月出版的,作者是ViktorMayer-SchÖnberger(维克托·迈尔-舍恩伯格)和Kenneth Cukier(肯尼斯·库克耶),译者为盛阳燕和周涛。
别的不说,整本书和之前看的《在线》相比,虽然出版早了好几年,但是整体逻辑和框架体系都清晰不少,而且用例很多,重复率也低,编排上类似国外的教科书,观点阐释、用例、重点小结都用不同的排版分辨出来。
书的重点是大数据后带来的三大方面的变革,包括思维变革、商业变革、管理变革。在思维变革方面,强调了大数据会使随机取样不是必需,不再强求精确度,以及更加重视相关关系而不是因果关系。在商业变革方面,主要是讲述大数据带来的商业价值,首先是量化一切,在此基础上通过再利用、重组、拓展、利用原有的数据废气、开放共享等方式挖掘数据价值,同时也试图对数据价值和折旧进行评估,最后说明了数据商业运作的几种方式。在管理变革方面,讲述了大数据时代带来的风险,并给数据管理上提出了几个建议和作者认为的大方向。
放上一张自己看完后整理的体系图。
整本书里有些观点还是有点嚼头的。
首先是关于大数据时代所有的根基——数据。
《大数据时代》告诉我们,数据化是指“把现象转变为可制表分析的量化形式的过程”,而数字化是“把模拟数据转换出用0和1表示的二进制码”。在我的概念中,可能更好的便于自己理解的表述是数字化是将信息录入电脑的过程,而数据化是按照统一的数据规范录入电脑可让机器分析的过程。这一点的确是戳中了要害,就和信息化最初发展的时候,人们觉得有电脑了,所有的信息都录入进去就完成信息化了的误区是一样的,大数据时代数据化的工作将会非常重要。
讽刺的是,从书里我知道“‘数据’data这个词在拉丁文里是‘已知’的意思,也可以理解为‘真实’”。然而,现在太多人都在追求大数据的“大”,而忽略了真实。诚然,如作者所说,错误并不是大数据固有的,但是数据量的急剧增加让更多错误数据又了藏身之所,可怕的是不仅从源头上的错误,更有层层数据交易中的有意为之。书中表达的大数据时代不追求精确度甚至拥抱混乱,并不是数据质量的参差不齐,只是指的数据来源和数据结构的不一致性吧。
接下来要说的是数据和人工,看起来是非常矛盾的两种方式,一种被信奉者捧成绝对理性,另一种似乎只是直觉、长期经验的复杂结果。
书里在辅助决策这方面虽然十分重视数据的力量,但是也不得不承认专家的作用性,甚至单独列了一节强调数据独裁可能的危害。在书的种种叙述中也不断提到了人在产生大量数据之外,对数据分析产生的作用,即使是对群租房探究而进行数据分析的小组成绩很好,也离不开组员不断的实地调查和实时对模型进行纠偏。甚至举出福特汽车和苹果的例子表述有时候真正的变革并不是数据能够分析出来的,这一点也很是很可贵的。
虽然大数据最厉害的地方就是能够较为精准的进行预测,但是一些创造性的突破性的想法和在一段时期后给世界带来的变化并不是通过大数据可以预测出来的。人,永远是数据生成、处理、使用上不可忽视而最无法精确衡量的环节,《大数据时代》没有忘记这一点,没有过分地去吹捧大数据。
最后要说说其中的管理建议了。在垃圾邮件还苟延残喘的时候,垃圾短信、诈骗电话、花式推销已经充斥了我们的生活,对方清楚的知道你的性别、姓名、年龄、职业甚至是家庭情况。大数据时代真是一个细思极恐的时代,各式软件的同意声明对于用户来说完全没有选择。在这方面我十分佩服一个朋友,所有的社交账号都是实名,而虽然知道自己的抵抗十分微弱,自己还是坚持起了一个又一个用户名,聊以在心理上自我安慰。
然而,无论是对个人隐私进行保护,给数据建立“谁使用、谁负责”的机制,不滥用数据,还是反对数据垄断,或者是数据审计师(书中称为算法师,感觉与描述的职责不太吻合)的行业兴起,都离不开国家强制力的介入。而最明显的表现,就是得有相关法律法规的建立健全和实施到位了。
尤其是数据“谁使用、谁负责”的机制,真的是迫在眉睫啊,目前使用中常见的都是个人许可制的,使用到一些软件让勾选的都是:您已经充分认识到您的某某信息是重要的,理解并知晓被提供和使用的风险,包括但不限于什么什么。拜托,你要是单纯的认识、包括也就还好了,什么叫充分认识啊,什么叫但不限于啊,我提供给你但是只限于你列出来的那几项行不行啊?倒是没有那个选项啊!
于是,想到搜索一下目前在数据管理、使用方面有没有相应的法律法规,也许是自己搜商不够高,暂时在意料之中的没有找到一个覆盖数据商用规范的法律法规,只有一些零散部委厅之类对本条线上数据管理的要求或规范。想来目前应该还是囊括在知识产权的相关法律法规里,然而看之前的郭敬明到现在的《锦绣未央》,原有的根基还远远不够稳固,要想有健全覆盖整个数据的法律法规看来还是有很长的路要走。
不过在搜索过程中有两个意外的发现,一个是发现政府网站上有一个很显眼的专栏“数据”,当然,对于我这个没有这方面数据思维的人,看到了也无法产生什么价值,但是可以看到政府对这方面的重视。另一个是发现了14年国务院对《香港和澳门服务提供者在广东省提供在线数据处理与交易处理业务有关问题的批复》,虽然批复内容在我看来就是“同意”二字,但是发现14年国内就有成型的数据商了啊,深深感到自己的落伍。
岔远了,回到这本书上来,《大数据时代》不仅告诉我们大数据时代数据能够做什么,还提醒我们不要忘记人能做什么,大数据是非常重要的资源,但归根结底还是人使用的一种工具。就像书中说的,“大数据提供的不是最终答案,只是参考答案”。