炮打传统数据处理司令部 ~从Google的那三篇大字报说起
曾经有一度,超级计算机是一个颇为科幻的名词,它高大上,高精尖,高逼格,属于“大国重器,不可曝于野,匹夫无可得知的牛逼状态”,从名字就可以嗅到一股站在宇宙中心呼唤新时代的感觉,譬如说什么银河x号,天龙几代,诺亚计划。那段时候,在it界搞超算,就好比是北京三环五套房,没有搞不定的丈母娘(老板)。不过也很容易理解,在单机时代,存储最大,处理器为王,我一秒跑100w数据就是比你一秒5w的牛逼,我一个月做的运算您得一辈子,一个函数咔咔咔验证二十年,人生几个二十年啊?所以他一直牛逼了几十年,直到有一天西方一声炮响,给我们送来了三篇论文,化整为零,各个击破,以空间换时间,带着万千中小企业的梦想,彻底砸烂了腐朽的单机处理大数据理论的狗头~
五四革命的时候引入了德先生和赛先生,呼唤革除旧弊,引导新生,以德赛二位先生作为精神导师,先驱楷模~这次的数据革命,也是引入了这样的三位先生,您问哪三位?
GFS
MapReduce
Bigtable
正是上述这三位,这三位先生,一位能吞吐山河,大肚能容万千数据。一位神机妙算,顷刻能解万亿运算。另一位治军森严,对于数据管理行禁有度。这三位就是Google在2003-2006年连续发布的三篇论文~可以说从这三篇论文发布之后,大数据才真正的走上了大众的视野之中,从此以后,数据处理从单机纵向扩展走向了分布式横向扩展的道路。
PS:
Google的三大核心技术MapReduce、GFS和BigTable的论文都已经被翻译成高质量的中文;三篇论文的链接地址如下:
MapReduce:
http://blog.csdn.net/active1001/archive/2007/07/02/1675920.aspx
GFS:
http://blog.csdn.net/xuleicsu/archive/2005/11/10/526386.aspx
BigTale:
http://blog.csdn.net/accesine960/archive/2006/02/09/595628.aspx
未完待续:
我是续~
上话说道三篇牛逼论文的横空出世,彻底的改变了大数据江湖的格局,作为一名新时代的青年,我们要本着知其然更要知其所以然的严肃学术态度,对这三篇论文有一个深入的探究。。。
简书-廉价pc多奇志,敢教日月换新天