吴军博士是在Google工作的自然语言处理与搜索专家,《智能时代:大数据与智能革命重新定义未来》是他继《数学之美》、《文明之光》、《浪潮之巅》之后在2016年推出的最新力作。我读完这本书之后,最深刻的感受就是在思维方式上受到的冲击,它让我在看待数据和解决问题时有了新的视角和方法。
这本书以去年大火的人机围棋大战开篇,介绍了Google的AlphaGo这一人工智能棋手,拉开了智能时代的大幕,然后讲述了大数据和智能技术如何改变我们的生活。作者在书中主要回答了以下问题:
一,人工智能问题如何转化为大数据问题并解决。
以前解决人工智能问题主要集中在如何让机器像人脑一样思考问题,强调模型及算法。现在的人工智能则采用模型简单、以强大的计算能力为支撑,以大量数据积累为基础的数据驱动方法。通俗地说,大数据方法对于问题不是从“0”开始思考,而是经过学习、即结合已知的丰富经验进行分析。比如AlphaGo,就是在积累、学习了成千上万棋手的棋谱后,根据当前棋谱计算下一步走哪里的胜算概率更大,由此决定走哪一步。
这一转化也给了我们启示:当按部就班无法得到满意结果时,应该考虑换个思路、换个角度来解决问题。就像书中提到,以前解决语音识别问题、机器翻译问题,都需要相应的语音专家、语言学家,从发音过程、语言结构等方面进行分析。后来人们通过逆向思维分析发现,要得到结果可以有很多方法,就像处理黑箱问题一样,只要输入、输出符合条件,里面的过程可以近似拟合。用大数据和统计方法解决这些问题,跳出了以前固化的思维模型,结合大量数据学习,效果反而远超传统方法。
二,智能时代的思维革命。
工业革命提出的机械思维认为万物都有因果关系、有确定的规律可循,这也成为了人类发现和认知世界的重要假设。然而,现实生活中存在不确定性以及不可测(或者说测不准),对这一类现象的发现挑战了人类的认知。例如对于股市的预测反过来会影响人们的买卖操作,进而有可能出现与预测相反的波动。
那么应该如何处理这些问题呢?与其逃避、不如面对。科学家引入“信息”这一概念,通过加入信息减少不确定性来解决这一类问题,并结合大数据的应用出现了一种以结果为导向的新型思维方式,即大数据思维。其特点是:无假设条件、重视结果分析,由此得到一种新的事物关系:强关联关系。
这一思维革命其实是人类更加理性客观世界的结果,针对事实分析事物联系,而不是去寻求因果关系。我觉得书中提到的药物开发的例子很有说服力。一般药品研发流程往往是先分析症状、查找病因,然后寻找能消除病因的物质。实际上,这种因果分析方法会造成可寻找的药物范围有限,因为我们人类对于很多疾病原因的认识并不明确,而有的药物其实可以治疗多种疾病。比如斯坦福大学医学院发现治疗心脏病的某种药对治疗胃病特别有效。以前这类发现只能通过医生在临床偶然发现。如果药企采用新的大数据思维方式,在研发时可以大胆主动地去探究药物与很多疾病之间的关联进而发现特效药,尽管有的结果看上去有些不可思议。
在《大数据时代:生活,工作与思维的大变革》一书中,作者引用普林斯顿大学心理学专家,同时也是2002年诺贝尔经济学奖得主丹尼尔·卡尼曼(Daniel Kahneman)的观点,也对人类的思维模式进行了分析。卡尼曼指出,人有两种思维模式,第一种是不费力的快速思维,通过这种思维方式几秒钟就能得出结果;另一种是比较费力的慢性思维,对于特定的问题,需要考虑到位。快速思维模式使人们偏向用因果联系来看待周围的一切,即使这种关系并不存在。这是我们对已有的知识和信仰的执著。平时生活中,由于惰性,我们很少慢条斯理地思考问题,快速思维模式就占据了上风,因此我们会经常臆想出一些因果关系,最终导致了对世界的错误理解。回想一下,我们是不是很多时候都是凭着以前的“因果关系”认识进行快速思维,比如“天凉了,加衣服,不然会感冒的!”这句话初听上去很有道理,因为大家每个人成长中都或多或少听过,觉得很耳熟。实际上,穿得多少与感冒之间没有必然的因果关系。而我们在做一些重要决定时,就会采用第二种慢性思维分析问题,但是这种思考常常缓慢而痛苦,并且没有头绪,表现为犹豫不决、优柔寡断。现在好了,借助计算机强大的计算能力,我们可以更加科学理性地分析事实与思考问题。
三,新时代的机遇与挑战。
“这是最好的时代,也是最坏的时代。”英国大文豪狄更斯的这句话用在这里实在是再恰当不过了。经历过工业革命、第二次工业革命、信息革命,新一轮的智能革命正在来临。她正在悄然改变人们的生活,购物、支付、出行等等都离不开互联网,我们进入了万物互联的“扫码”时代。同时,我们也看到,机器智能的崛起开始让很多人丢了饭碗,比如制造业。现在服务业也慢慢被机器智能所代替,比如随着电子化停车场、线上超市的发展,停车场管理人员、超市导购员等工作人员的数量都将大幅缩减。
那么,如何拥抱智能时代?传统行业该何去何从?作者给出了很好的建议,传统行业可以通过与新技术融合产生新行业来得到发展。书中以小米和特斯拉为例,它们并不是手机公司、电动汽车公司等传统意义的制造公司,而是定义为互联网公司,即通过手机、电动汽车为平台、为顾客提供后续个性化的终端服务,这正是值得传统家电企业学习借鉴的。家电属于耐用品,很多家庭买了一台电器可以使用很多年,提高新产品的销售额很困难。然而,如果能通过智能终端收集数据、分析顾客使用需求并提供后续全面的个性化服务,可以收获比销售新机器更多的利润。
智能时代的另一大挑战则是来自隐私安全方面。现在数据使用缺乏监管,很多时候为了获得APP、软件的使用权,我们都在收集使用数据一栏点击“同意”,可是,那些使用数据的公司会将数据拿来做什么,我们并不知道。当公司、团体可以收集用户数据进行数据挖掘甚至个人画像时,其实我们的隐私已经暴露无遗,甚至可能在不知情的情况下导致利益损害。比如,当航空公司发现某一顾客对价格要求不敏感时,可能给该顾客的报价就会偏高。
针对这一问题,作者提出了两类解决办法:一是可以模糊处理,使处理数据的公司只能得到大概数据、不能得到精确的细节信息从而无法定位到个人。二是设立双向监视机制,使数据使用者在使用时留下痕迹,从而会规范其使用行为。我个人认为,数据的所有权、使用权目前亟需得到关注、重视与规范和约束。很多时候,人们往往轻易地将自身相关的数据交付出去,而后续数据公司会如何利用数据,是否会危害我们的利益和安全,对此我们一无所知。如何在发挥数据价值与保证个人隐私安全之间平衡,也是值得我们深思的问题。
在看这本书的时候,我跟随吴军博士一起追溯工业社会的科技发展,又展望智能时代的前景,惊讶于技术的发展之快,畅想不远的未来。在ALphaGo战胜韩国高手李世石后,很多人担忧机器人会超过人类甚至统治人类,对此我并不认同。机器智能最终还是要由人类制造、受控于人类,所以关键在于如何使用。如果说每一次新技术的出现就是一把双刃剑,那么结果的好坏就取决于人类将其应用到何处,所以,最后决定我们未来的不是机器人,而是我们人类自身!
�t!�uHE�O