大数据的好处远不止是成本和准确性的问题,他的优势还在于多维度(也叫全方位)。过去的计算机由于能够存储和处理的数据有限,只能收集与待解决问题相关的数据,现在云计算的出现,使我们可以存储处理复杂的甚至原来看起来没有用的数据。从而导致了我们工作方法的改变,除了使用已有的模型进行数据处理,还可以不带任何固有的想法,看看数据本身能够给我们带来什么样的结论。
比如,在美国医院发现很多急诊病人在出院不久后,又被送回了急诊室。医院和保险公司把这些病人的数据送给微软,希望能找到什么原因和规律。微软的科学家们用机器学习的方法,分析和抽取了上万种特征,最后发现,如果病人第一次进急诊后打了点滴,他们几星期后被送回的可能性很大。针对这个情况,医院安排了对这类病人定期的回访合跟踪,可以大幅降低返回急诊室的几率。
还有一个用途就是利用大数据进行统计。这个方法对于医疗、金融等行业尤其重要。比如,按传统流程,一种新药和治疗方法从提出到应用经历反复试验、排查往往要花十几年才能成功。现在,科学家的做法与之前相反,他们先从数据统计出发,找出疾病和基因缺陷的相关性,然后再分析造成这样相关性的内在原因,从而得到新药或者新的治疗方案,这样更高效准确。当然,前提是能够收集到足够的基因样板和疾病的比对信息。因此,美国政府和医疗机构已经开始整合所有医院的疾病数据,这样才能积累足够的医疗疾病大数据,可以用于分析疾病和基因之间的相关性。
在未来的世界里,人们的生活越来越离不开数据,很多围绕数据收集和处理的工作会不断涌现,而那些能掌握数据处理和利用数据方法的人也必将成为新时代的成功者。