《大数据时代》读书笔记(上)

维克托·迈尔-舍恩伯格[英] 肯尼思·库克耶[英]著,盛杨燕 周涛译

第一部分,大数据时代的思维变革

2009年的H1N1病毒,爆发时谷歌比官方更早预测到了,这是基于海量用户搜索信息分析的结果,利用已有信息,其他公司还可以预测机票价格的变动。

人们所有行为都会留下痕迹,现在存储和分析信息的成本越来越低,大量存储和利用信息成为可能,我们进入了大数据时代。

大数据的核心就是预测,在数据使用上有三个转变:一是可以处理相关的所有数据而不是以往的取样分析。以前用随机采样的小数据方法,用最少的数据获得最多的信息,因为获取和存储分析数据难度很大,随机采样法是不可收集全部数据的情况下的选择,本身还是有许多固有缺陷。它的成功依赖于采样的绝对随机性,但在实际运用中实现随机性非常困难。大数据指不用随机分析法,而采用所有数据的方法。样本=总体。

二是不必追求数据的精确度,人们分析的是趋势而不追求精确度。大数据通常用概率说话。大数据的简单算法比小数据的复杂算法更有效。大数据要求我们必须接受混乱和不确定性,认为每个问题只有一个答案的想法是站不住脚的。

三是不再热衷于寻找因果关系,我们不必知道“为什么”只需要知道“是什么”。在大数据背景下,相关关系更能够帮助我们认识和分析事物。相关关系是指当一个数值增加时,另一个数据值很有可能也随之增加。通过找到一个现象的良好的关联物,相关关系可以帮助我们捕捉现在和预测未来。建立在相关关系分析法基础上的预测是大数据的核心。

在社会环境下寻找关联物是一种方法,另一种方法是通过找出新种类数据之间的相互联系来解决日常需要,通过找出一个关联物并监控它,我们就能预测未来。

这个系统依赖的是相关关系,而不是因果关系,他告诉你的是会发生什么,而不是为什么发生,这正是这个系统的价值。通过去探求“是什么”,而不是“为什么”,相关关系帮助我们更好的了解了这个世界。

第二部分,大数据时代的商业变革

一、数据化——一切皆可量化。

莫里的导航图是大数据的最早实践之一。大数据发展的核心动力来源于人类测量、记录和分析世界的渴望!

“数据化”是指一种把现象转变为可制表分析的量化形式的过程。与之不同的是,数字化指的是把模拟数据转换成用0和1表示的二进制码。量化一切是数据化的核心。

当文字变成数据,人可以阅读,机器也可以用之分析。位置信息能够变成数据,人的沟通也能变成数据,世间万物都可以数据化。将世界看作信息,看作可以理解的数据的海洋,为我们提供了一个从未有过的审视现实的视角,它是一种可以渗透到所有生活领域的世界观。

二、数据的首要价值被发掘后仍能不断给予,它的真实价值就像冰山一样,绝大部分都隐藏在表面之下。

在数字化时代,数据支持交易的作用被掩盖,数据只是被交易的对象。而在大数据时代,事情再次发生变化。数据的价值从它最基本的用途转变为未来的潜在用途。这一转变意义重大,它影响了企业评估其拥有的数据及访问者的方式,促使甚至是迫使公司改变他们的商业模式,同时也改变了组织看待和使用数据的方式。

不同于物质性的东西,数据的价值不会随着它的使用而减少,而是可以不断地被处理。

数据的价值并不仅限于特定的用途,它可以为了同一目的而被多次使用,也可以用于其他目的。要了解大数据时代究竟有多少信息对我们有价值,后面这一点尤其重要。

最终,数据的价值是其所有可能用途的总和。这些似乎无限的潜在用途就像是选择,这里不是指金融工具意义上的选择,而是实际意义上的选择。这些选择的总和就是数据的价值,即数据的“潜在价值”。

数据创新1:数据再利用,2:重组数据,3:可扩展数据,4:数据的折旧值,5:数据废气,6:开放数据。

数据价值的关键是看似无限的再利用,即它的潜在价值。收集信息固然至关重要,但还远远不够,因为大部分的数据价值在于它的使用,而不是占有本身。

三、数据、技术与思维的三足鼎立。如今,我们正处在大数据时代的早期,思维和技术是最有价值的,但是最终大部分的价值还是必须从数据本身中挖掘。

大数据价值链的3大构成:第一种是基于数据本身的公司,第二种是基于技能的公司,第三种是基于思维的公司,所谓大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。

到目前为止,前两种因素一直备受关注,因为在现今世界,技能依然欠缺,而数据则非常之多。近年来,一种新的职业出现了,那就是“数据科学家”。数据科学家是统计学家、软件程序员、图形设计师与作家的结合体。与通过显微镜发现事物不同,数据科学家通过探寻数据库来得到新的发现。全球知名咨询管理公司麦肯锡,就曾极端地预测数据科学家是当今和未来稀缺的资源。如今的数据科学家们也喜欢用这个预测来提升自己的地位和工资水平。

会出现一种全新的数据中间商。现今,我们正处在大数据时代的早期,思维和技能是最有价值的,但是最终,大部分的价值还是必须从数据本身中挖掘。因为在未来,我们可以利用数据做更多的事情,而数据拥有者们也会真正意识到他们所拥有的财富。因此,他们可能会把他们手中所拥有的数据抓得更紧,也会以更高的价格将其出售。继续用金矿来打比方:只有金子才是真正值钱的。随着数据价值转移到数据拥有者手上,传统的商业模式也被颠覆了。

同样地,人类从依靠自身判断做决定到依靠数据做决定的转变,也是大数据做出的最大贡献之一。行业专家和技术专家的光芒都会因为统计学家和数据分析家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出的声音。他们的判断建立在相关关系的基础上,没有受到偏见和成见的影响。

大数据让处于行业两端的公司受益良多,而中等规模的公司要么向两端转换,要么破产。传统行业最终都会转变为大数据行业,无论是金融服务业、医药行业还是制造业。当然,大数据不会让所有行业的中等规模的公司消亡,但是肯定会给可以被大数据分析所取代的中等规模公司带来巨大的威胁。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,427评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,551评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,747评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,939评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,955评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,737评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,448评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,352评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,834评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,992评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,133评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,815评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,477评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,022评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,147评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,398评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,077评论 2 355

推荐阅读更多精彩内容