【ETL】系列一:我所经历的ETL的三个阶段

      ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至目的端的过程。       

作为一个做了快三年To C端产品的PM来说,初识ETL的概念,源自刚开始进入TO B金融数据处理系统时一个资深PM的引导。只要做数据,不管是结构化数据还是非结构数据,不可避免地需要涉及到数据的抽取、清洗、转化,并同步给各个产品端来使用,我所在的数据工具团队团队首先需要支持的就是各个分层数据的推送处理,如何设计一套数据推送工具,能够让数据业务团队能够操作简单、快速上手、实时同步、性能稳定,是摆在我们面前的一道难题或者说是新的挑战。

由于自己所在的产品线经过一些调整,产品的整个生命周期没有完全参与进去,陆陆续续地作为ETL的产品经理去改造设计、商业变现,也对ETL这一产品有比较深的理解和感悟,在此分享给大家,只要能给你带来一点启发就足矣。

关于ETL这一产品经历了从初探、深入到成熟的三个阶段。

阶段一:初探阶段

数据业务方挂在嘴边的数据推送,一开始是通过开发写代码实现的,涉及到的数据业务表少的话,可以这么做,但是随着数据业务的发展,需要推送处理的业务表增加到了几十个了,由开发处理不仅耗时、维护还困难,于是就开始了自研版的ETL1.0的推送工具设计和研发。

上线的ETL1.0版本,确实起到了很大的作用,业务人员通过简单的推送模型配置和调度配置即可快速完成1个数据表的推送,经过几个版本的迭代,很多业务所需要的推送需求都迁移到了ETL工具上,省心省力。

然而,数据量越来越大,业务的复杂度越来越高,ETL的矛盾已经转化为日益增长的大数据量的业务需要和同步性能跟不上的矛盾,主要体现在:数据源与目标源的数据业务差别越来越多、转化配置需求愈发地多样和高频、大数据量的同步性能也有了瓶颈。。。。。。

慢慢地也就开启了ETL2.0阶段——基于开源的Kettle工具来进行数据的抽取、转化、加载。


新生树苗


阶段二:深入阶段

从自研的ETL1.0阶段进入基于Kettle二次开发的ETL2.0阶段,是一个重要的转变,也是一个正确的转折点。

在ETL1.0阶段,积累了大量的业务使用场景,这对于To B产品而言,可以更好地在Kettle的基础上,去深入到产品易用性、稳定性的研究上。

盗图侵删

“免费开源的基于java的企业级ETL工具,功能强大简单易用,无可抗拒! ” 

基于此,开发人员开始了ETL的研究,在这一过程,对于产品经理而言,也是有诸多挑战。

产品经理在这一阶段能够做什么?如何发挥自己的价值?

对于缺少技术背景的产品而言,如何与开发、测试、业务人员更好地配合,快速把kettle用起来?

基于Kettle的二次开发后的产品,如何更大程度地满足业务人员的业务需求和使用习惯?

如何面对复杂的内部业务和外部客户,将ETL产品化和商业化?

TO B产品只有用起来,才能好起来。ETL 2.0阶段初始,面向的是内部数据业务部门,随着对外客户需求的挖掘和拓展,发现这一需求在很多行业都有广泛深刻的痛点,这一产品在很多数据部门都有切实可行的应用场景。于是乎,一个个项目的POC开始了。

POC测试,即Proof of Concept,是业界流行的针对客户具体应用的验证性测试,根据用户对采用系统提出的性能要求和扩展需求的指标,在选用服务器上进行真实数据的运行,对承载用户数据量和运行时间进行实际测算,并根据用户未来业务扩展的需求加大数据量以验证系统和平台的承载能力和性能变化。

经过POC过程中的打(shou)磨(nue),产品的功能日益完善、性能日益提升,产品慢慢好用了起来。


成长小树


阶段三:成熟阶段

为什么说ETL进入了成熟阶段?那是因为可以商用了,有客户买单了。

这一阶段,ETL进入3.0阶段,内部业务部门使用、外部签约客户实施、新的商业机会验证,纷纷给这一时期的ETL带来了养分,引导着他茁壮成长,也慢慢成熟,最为产品经理而言,也甚是有老母亲的欣慰感。


成熟大树


ETL会不断迭代,进入4.0/5.0/6.0时代,或许之后的roadmap我将无法参与,但是曾经1年多的产品经历,希望可以进行回顾、复盘、总结,能够给后来的人一些ETL产品生命脉络的溯源,也希望让自己一个完整的交代。

接下来,我会从自己的产品视角,去做一些ETL产品的科普或者说是分享。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,423评论 6 491
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,147评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,019评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,443评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,535评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,798评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,941评论 3 407
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,704评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,152评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,494评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,629评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,295评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,901评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,742评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,978评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,333评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,499评论 2 348

推荐阅读更多精彩内容