近来研读了很多数据驱动方面的书籍,以此重新思考数据驱动企业发展的逻辑、阶段,并对日常工作中面对的具体任务进行拆解。
文章结构
数据驱动的逻辑
企业经营的过程是由一系列的决策构成的。譬如,创业公司为了探索新的业务场景,上线了新的业务线,管理层需要知道新业务线表现如何,对全局的影响如何,目前哪些执行动作需要做出调整;又如,对于运营人员来说,最近有一个促活活动,要如何给用户分群,可以实现 ROI 最大化;而对于产品同学来说,他们关心的是下次迭代哪个功能,可以让用户更满意、更爽。数据作为一种「精细化」的工具,参与到企业运营的决策中去,减少「人治」,以自动化的方式驱动业务发展,以此来「降低成本,提高效率」。
决策的过程可以抽象为:面临问题--›思考并列举出有哪些解决方案--›从中选择某个适当的方案解决问题。数据帮助解决决策过程中的三类问题,分别是:「是什么」「为什么」「怎么办」。
-
「是什么」
一般是用描述性的统计方法,定量或者定性地出呈现出事物/问题样貌。比如,通过对全体用户的分析盘点,可以帮助企业掌握用户规模、质量,以及用户的新增、活跃、留存及流失情况,定位业务的发展阶段,是处在引入期、成长期、成熟期、衰退期、流失期。指导平台把握大方向,找准当前的发力点。 -
「为什么」
对具体的问题做数据分析,找出问题的原因。比如,我们发现某天客户端的访问量激增,我可以通过数据分析定位原因。分析的思路可以是这样:首先了解流量的来源,流量主要可以分为广告流量、SEO流量、搜索流量、直接流量、及其他流量来源;定位具体是哪些分类流量明显增长;然后根据不同流量来源类型来分析,如果是广告流量明显增长,可能的原因为:1)广告位置变化,比如以前这个广告的位置在角落里,现在放到了首页非常显眼的位置;2)广告创意优化,符合用户使用习惯;3)广告所在页面流量激增。如果是其他来源的流量,也可以做相应的分析。 -
「怎么办」
基于「为什么」问题的分析,结合业务背景和手头的资源,提供可选的建议,最后交给运营或者管理层来拍板选择相关可行方案。
数据驱动的阶段
由于起步早晚、数据量级、技术能力、商业环境等因素的不同,数据团队面临着不同的发展阶段。每个阶段都会涉及到要解决上面提到的「是什么」「为什么」「怎么办」的问题,但对不同的问题的解决程度、方式是不一样的。按照日常数据工作中面临的问题,将数据驱动发展的阶段分为:数据可视化阶段、数据分析产品化阶段、数据驱动阶段。
数据可视化阶段
这个阶段是数据团队发展的早期阶段。面对的问题是,想要数据的时候没有数据。所以,在这个阶段,我们需要做的就是让数据可以快速、直观、全面的展现出来——数据可视化。数据分析产品化阶段
数据可视化主要做的是把数据呈现出来,减少了人肉提取数据的重复劳动。但对于数据驱动整个过程而言,这只是一个开始,我们只是将数据堆叠在系统上,如何把这些数据组织起来,去分析出「是什么」「为什么」「怎么办」,还要数据分析师来做。在这个阶段,我们需要将数据分析师头脑中的分析模型、分析思路固化到系统中,更进一步地降低数据分析的成本,提高效率。数据驱动阶段
这个阶段,数据将成为基础设施,数据的意识深入到公司的各个层级,业务运营的各个环节也有数据参与其中,所谓的「业务数据化,数据业务化」。数据成为业务的一部分,变被动为主动,以前根据业务的需求提取、加工、展示、分析数据,现在数据部署到业务的各个环节,让它们自动化地运行起来,主动发现问题、分析问题的原因、给出解决方案。
数据驱动的任务拆解
不同发展阶段,有不同的核心目标,可以拆解出不同的任务。下面分不同的阶段介绍。
1. 数据可视化阶段
核心目标
从没有数据到数据报表,再到统计图的过程。
任务拆解
1. 盘点数据资产
盘点相关数据,包括已经同步和未同步到数据团队的各项数据。在已同步到数据团队的数据中,需要盘点数据库的表,有哪些字段,每个字段的含义是什么,最终形成数据字典,可上传到共享文档中,或放到元数据系统中,目的是让团队相关人员都能看到;未同步到数据团队的数,整理出可能需要的数据,以及数据的来源,并记录下数据更新的时间。
2. 建立数据处理和数据映射(ETL)
对数据进行清洗、转换;3. 建立数据的关联
面向要分析的问题,将数据关联到一起。4. 数据可视化
选择恰当的图表,呈现数据。
2. 数据分析产品化阶段
其实在可视化的过程中,已经加入了部分的分析逻辑。比如将数据按照不同的用户群、不同渠道、不同时期进行拆分,之后进行比较。在数据分析产品化阶段,不仅要将数据放到系统中呈现,还要将分析模型固化到系统中去,进一步自动化消除重复,提高效率。这里的重复,主要指的是数据分析师日常分析工作中基础的、同质化的分析工作。比如,使用Excel工具,不断地将相关数据组合到一个统计图当中,以观察哪些数据组合更具有分析价值。
核心目标
将分散在各个分析师身上的零散的、同质化的工作量,通过工具化、自动化的方式呈现出来,帮助数据分析师快速寻找到分析思路。
任务拆解
1. 需求分析(明确关键问题)
数据分析的目的是为了解决业务上面临的问题。不同的业务面临不同的关键问题,问题决定了数据分析的方向。比如流量运营的关键问题是:用最少的钱拉来最多的优质用户,因此,分析的重点方向就是ROI。再进一步,数据还可以细分为不同的渠道。这些问题将引导我们从粗略的方向,向着更细维度的方向思考。我们可以通过形成「关键问题树」的方式来做需求分析。关键问题就是根节点,根据不同的方向,不断拆解深入问题,直到能够与具体的数据项对应上。
2. 数据分析
在明确了关键问题树后,当问题发生时,我们可以快速的定位问题。对于出现问题的部分,进行深入的分析;而对于问题树上下游相关的问题,也需要进行深入的分析。
3. 关键问题树的优化与系统化
当积累了一定的数据分析经验之后,我们就可以优化调整关键问题树,将它固化到产品中。具体要做的,就是将问题树中不同的分支拆解成各个模块,把相关的指标、维度组织到产品模块中去。
4. 建立衡量标准
最后需要设定对产品和业务的衡量标准。衡量标准,通俗一点来说就是发生异常情况的阀值。比如,一款产品每天新增用户不得低于5000人,这里的「5000」就是一个衡量标准,我们可以为系统设定一些行动事项(常见的形式为报警),某天新增用户数低于5000人时,系统会发送报警邮箱,或者在系统中标记出异常,并提供准备好的数据供数据分析师分析问题。
3. 数据驱动阶段
终于写到终极阶段——数据驱动了。在这个阶段实际工作的经验不多,以前在大厂工作时,手上的工作更偏前端(对外的解决方案),目前的小公司还没到达这个阶段。所以具体的任务拆解难以下笔,只能简单谈一谈对数据驱动阶段核心目标的看法,期待与各位的讨论。
核心目标
「业务数据化,数据业务化」中的「数据业务化」是这个阶段核心思想。「数据业务化」指的是将数据变成产品和业务的一部分,更多的依赖数据来做决策,实现自动化。注意这里说的是让数据直接做决策,而不只是简单的数据可视化和分析,比如推荐,数据本身就是产品的一部分。
任务拆解
持续实践中,学成补充。
非常期望与各位同学讨论、学习。
最后,祝各位成长快乐:)