鸡生蛋还是蛋孵鸡,这个问题仿佛永远也说不清。但是,车和马的顺序恐怕没有什么争议,马拉车中外皆然,大概没什么人会认为车可以拉马,大概也没什么人会尝试让马推着车走。基于这种共识,英文中有一个词叫做”cart before the horse” (车在马前),形容搞不清楚事情先后顺序的情况。
现实生活远比马拉车要复杂得多,事情的先后顺序并不总是一目了然。是先出现了一个问题再去寻找解决问题的技术和方法还是先有了一项技术的发展再去思考这项新技术有什么实际用途?前几年去康宁玻璃博物馆参观的时候很惊讶的发现康宁在通信等高科技领域有非常重要的地位,而在此之前我一直以为康宁不过就是做餐具的。今天得以广泛应用的光纤通信要归功于康宁在光纤制造技术方面的重大发明。然而康宁的科学家发明这项技术的时候完全不知道光纤有什么用处,它的发明纯粹是为研究而研究闭门造车的结果。这项专利被束之高阁很多年,直到光纤通信的理论和其他各项配套技术得以长足进步之后人们才意识到光纤有什么用。
再举个例子,今年的诺贝尔物理学奖颁给了三位在“拓扑相变和拓扑物态的理论发现”中做出开拓性工作的科学家。在他们之前,拓扑是一个纯数学的概念,描述的是几何图形或几何空间在连续改变形状后还能保持不变的性质。别问我这句话是什么意思,因为拓扑学基本上就是一个用来烧脑的东西。这个数学工具被发明出来以后很长的时间,并没有什么实际应用。这并没有错,因为数学的发展从来就不是以解决实际问题为驱动的。而当这几位物理学家把拓扑的概念引入到物理学的研究中以后,一扇大门被轻轻地推开了,一个崭新的物理学研究领域被开创出来,并由此催生了众多新的物理概念,为材料科学的发展梳理了新的理论脉络。
商业领域也是这样。大数据这几年是一个炙手可热的词,每个人都在讨论大数据在各个方面的应用前景和由大数据技术带来的前所未见的商机。今天看到的一份材料,却似乎有点不合时宜。知名科技趋势研究公司Gartner发布了一项最新调查结果,显示各大公司在大数据方面的投入虽然持续增长但是增长趋势放缓,并且计划在大数据方面有所投入的公司数量在减少。Gartner对此调查结果进行了种种解读,分析了可能影响投资决定的原因。但是,就我个人在大数据方面的经验而言,这些分析也许并没有切中要害。大数据技术的关键在于它能够以接近实时的速度分析海量的非结构化数据,从而快速准确地为商业决策提供依据,并且站在一个新的高度为决策者指引方向。打个比方,过去的统计分析就好像垂钓者坐在船上找鱼,好的分析师或者统计学家就像有经验的渔夫,知道什么地方有鱼讯,把船开过去碰运气。有的渔夫熟悉岸边的鱼情,有的渔夫喜欢湖中央的深水垂钓。要想抓到更多的鱼,就需要更多的船更多的渔夫。而大数据技术和机器学习技术就好像直升飞机,飞在天上往下看,不管岸边还是湖中央,哪儿有鱼就奔哪儿去。听上去是不是太美好了?的确,好得有点难以置信。一件事凡是听上去好得难以置信,它往往就真是不那么靠谱。捕鱼这件事,直升飞机让我们得以快速准确地了解鱼情,但是它并不能解决鱼竿鱼钩的问题。一根鱼竿如果挂一个鱼钩它一次就只能钓一条鱼,要想拉一次钩钓上好几条鱼那你就得多挂几个鱼钩,要想钓得更多就需要给每个渔夫多配几根鱼竿,更进一步,就干脆不用鱼竿钓鱼而是拉网捕鱼。可是,如果法律规定一个渔夫只能用一根鱼竿,一根鱼竿只能挂一个鱼钩,并且不能用网捕鱼,那么即使我们可以十倍于现在的速度发现鱼情,可以找到比现在多得多的鱼群,受到鱼竿和鱼钩的限制,我们并不能抓到更多的鱼。在整个捕鱼这件事情当中,直升飞机成了最不重要的一环,鱼竿鱼钩的限制——不管这个限制来自法律规范、捕鱼技术、还是资金投入——反而是最大的瓶颈。现在很多公司,特别是传统行业,在面临大数据带来的机遇的时候,难题不是发现问题的速度,而是执行能力在掣肘。回到车和马的例子,大数据好比是把马换成了汗血宝马,但只要车还是那辆千疮百孔轮胎破了不知道多少个洞的车,马跑得多快又有什么用呢?
(图片来自网络。参考资料来自《知识分子》微信公众号和gartner.com)