我在大数据工作中的挑战(1)-选择,统一

在大数据的背后,我们无法直接目击的是超乎想象的大量数据,它们来自你无法预料的不同地方,不同的时刻,来自与人或者机器,它们的行为会混杂在一起,但有时又会出现“分歧”。大数据的种种挑战,大家可能已经耳熟能详。但请牢记,解决这些突破传统的问题就是我们的工作职责。

如何选择,如何统一

在语言和架构上,大数据和以往的网站开发,移动开发不一样,不是指具体的工具,而是大数据需要选择的太多。
首先是确定语言,网站开发无外乎JS,PHP或后端JAVA,移动开发更是大统的两种语言。而大数据?我是JAVA程序员起码,进入大数据后还掌握了SCALA和PYTHON,变得博而不精,因为哪怕只有一种语言都可以承担起大数据,但承担不好整个大数据。各行各业的公司都想轻松利用大数据,不需要太多的成本。如果你是负责人,就不得不考虑这个问题。要考虑公司已有的语言和第三方的语言,JAVA是个轻松的选择,应该它各方面都比较成熟,而且也适合团队协助。但它也未必一劳永逸,最主要的,它的人力成本不低,你需要供养一个大团队。而且如何与使用其它语言的合作方对接是同样要处理的问题。像SCALA和GO有明显的优势,但招聘和培训是个全球问题。
从我们自身出发,我们应该如何应对呢?其实大数据工程师是没有什么选择权的,这是个百家争鸣的大时代,由出生决定选择和路线。国内大公司多数是JAVA的大团队,万能且可靠可控,自己可以再捣鼓下SCALA。周边团队也职责清晰,跨语言的需求也不大或者稳定。而其它公司需要的是一条龙服务,这时就需要灵活了。多语言跨语言是必须的,Python一般是必需品,上手快开发快应对场景也广,和科学家合作或兼职科学家也直接方便。和其它语言更密切相关的是SDK,这个无法强求,什么时候来,来不来多留就好。还需要多扩展,看公司的主要领域,哪种语言更好,得保持互相学习和培训。总结来说,多语言是王道。
其次是架构和挑选“工具”。其它工程师对大数据的第一印象就是工具,这是无可厚非的。大数据的landscape里的图标就和你现在看到的字体一样大,每年还在缩小一个px。商用的开源的孵化的一大批,学全是不可能的,这辈子都不可能涉及完这个landscape的,哪怕最大的几个图标的掌握也不可能一年两年实现。公司需求变化快,调研和落地同一个deadline,想想就头痛。架构也是,一代接一代,是否追逐最新的架构,Kappa如何?一步到位,根治问题。
具体的工具和选择我无法细说。一个建议,先划分清楚自己和公司的领域,需求硬不硬,公司需求的收益和成本能不能平衡。百花齐放的landscape,要不想乱花迷眼,自然是想清楚自己是要采药,别想采花。要明白大数据不是单个领域,可以按照landscape的划分来采购,不是最紧急最基础的领域千万别留步。最核心的组件都要熟悉,毕竟原理和理念都是最经典的,对新组件的入手会很有帮助。架构也是,合适最重要,如果没有一个不求汇报的金大腿,简洁些比求新求全好,历史债务是不可避免的,首先实现最小的需求,启动组件最小的功能。最后要做好心理准备,“不计较全面不计较白费功夫”,走上架构师的同行共勉。
欢迎大家留言,也希望您能点个赞。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,686评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,668评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,160评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,736评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,847评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,043评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,129评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,872评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,318评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,645评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,777评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,861评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,589评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,687评论 2 351

推荐阅读更多精彩内容

  • Spark SQL, DataFrames and Datasets Guide Overview SQL Dat...
    草里有只羊阅读 18,307评论 0 85
  • 背景 我们所有产品在初期的时候都使用的Java语言作为后端开发语言,整个架构在演进了几次之后形成了基于微服务的一个...
    墨弈阅读 2,575评论 1 49
  • 周总结 忙碌已有一个月有余,有时坐在书桌前时已是11点,各种生活和工作事务让人身心疲惫,但这些是我必须要承担的,因...
    玻璃先生阅读 159评论 2 2
  • 我总是这样,总是这样辜负爷爷奶奶的期望,可是我不想让他们失望。 所以不要再去想过去是怎样的了,想想现在和未来,你想...
    小和尚的老腊肉阅读 100评论 0 0