数据指标体系建设

一、数据指标体系建设的意义

1.通过指标体系的梳理搭建能够更加全面的监控业务发展,及时准确的发现业务机会/问题。
2.统一指标口径,降低公司内部数据对接时的沟通成本。

二、数据指标搭建模型
(一)osm-明确业务目标,数据赋能业务
▪ O(Objective):是指我们的业务目标。在这个环节我们需要思考或者回答的问题是,我们的业务、产品,甚至是其中的一个小的功能,它存在的目的是什么、能够解决用户什么问题、满足用户的什么需求?

▪ S(Strategy):是指清楚业务目标之后,为了达成上述目标,我们应当采取的业务策略。

▪ M(Measurement):是用来反映业务策略有效性、反映策略执行是否能达成业务目标的度量指标。

(二)AARRR模型和UJM模型--理清用户生命周期以及行为路径
1、ujm
梳理用户生命旅程,与业务目标耦合

我们需要为每一个阶段都设置对应的一个目标。在这一思路中设置出的目标就可以去反哺我们之前制定出来的 OSM 框架,判断其是否有遗漏。各阶段目标确定后,我们需要寻找到产品中为了达到这一目标,与用户产生的接触点,例如首页、搜索页面、商品类目页等就是用户逛产品时的接触点。了解接触点之后,我们紧接着就能够找到每个环节的痛点,而痛点的反面就是我们的机会点。同时,这里每一个机会点都可以反哺前面 OSM 框架中的 S,就是我们的策略,机会点是否与策略相互吻合。所以 UJM 的价值就在于,这样梳理了用户旅程之后,将 UJM 和 OSM 进行关联,就可以起到用户旅程与业务目标相互耦合、相互影响的作用,使得我们的业务目标能够满足用户需求,我们策略能够回答业务问题。

2、aarrr
AARRR模型是基于产品角度,简单地来说就是拉新,促活,留存,付费,推广。对于一款产品来说,我们首先要从各个渠道获取用户;其次需要激活这些用户并让他们留存下来;对于留存下来的用户引导他们付费以及推广产品。

(三)mece模型--指标体系分级治理
首先我们明确了业务核心目标;其次,我们将业务核心的KPI下钻到产品生命周期或者用户路径行为中;接下来我们需要对这些核心KPI向下进行三到五层的拆解,这个过程我们成为指标体系分级治理,用到的模型是MECE模型。MECE模型的指导思想是完全独立,相互穷尽,根据这个原则拆分可以暴露业务最本质的问题,帮助数据分析师们快速地定位业务问题。例如,客户总成交额GMV进行以及拆解可以是付费用户数与平均客单价的乘积。

(四)具体搭建思路
1、公司核心指标拆解——mece
基于公司核心净销售额指标进行拆解,对指标进行分级。

以下为部分样例,主要基于公式拆解对于公司指标进行分级。基于要素法对各个维度进行拆分。

2、各业务线指标拆解

由于每个业务线对平台产生的价值不一样,所以对于各个业务线具体的考核指标是不同的。

对于东家来说,0元拍是为了吸引用户参与拍卖;直播拍、专场拍是为了产生交易额;拍卖行是为了拍卖重器。针对每个业务线需要梳理对应业务线的指标体系。目前我们主要采用 osm * ojm的模型进行梳理。

例如下面针对榜单工具的指标梳理流程:

(一)osm模型

o目标:提升静态商品用户浏览转化率

s策略:榜单工具

m度量:①由榜单进入的静态商品详情页-付款转化率 与 普通静态商品详情页-付款转化率对比 —— 判断榜单对于商品详情页-付款转化的帮助。

②榜单页面的付款转换率与其他超级模板付款转化率对比 —— 判断榜单整体页面转化

度量一是本次看板需要制作关注的目标,度量二是可以通过已有看板查询。

(二)ujm模型

用户旅程地图见下图

[图片上传失败...(image-a91c73-1638794067131)]

重点关注商详-付款的转化数据,同时将榜单的上级来源页面的uv分别统计

三、数据指标中心

(一)概念

数据指标中心是规范化开发指标并对其进行管理维护的系统,将指标的组成部分解耦拆分开来,并在逻辑表中进行规范性的定义,在此基础上,后续可以按照一定规则进行自由拼装,实现自定义指标的功能。

(二)如何建立数据指标中心

1、首先定义指标并归集到对应的主题域
指标的本质是量化了的目标,比如常见的例子:

①我们要把用户的盘子做大,那对应的量化指标就是已注册用户数;

②我们要统计今天的销售额,那对应的量化指标就是总支付金额;

③我们要衡量一次活动的效果,那对应的量化指标就是下单率。

从上面的例子我们可以看到,我们比较常用的几个类型的指标就是,存量型指标(已注册用户数)、事务型指标(支付金额)、转化型指标(下单率),其它还有比例型、统计型、排名型等,这些比较不常用,就不在此赘述了。

这些不同类型的指标,分散在我们产品中的不同功能模块中,所以为了更好地规范与管理,我们需要将这些指标也按照主题域的方式归集起来。主题域在“仓库模型中心”进行创建与定义,在这里只需要将对应的指标划归到对应的主题域就行了。

图片

2、然后是拆分原子指标与派生指标

先来看看原子指标跟派生指标这两个概念具体是什么?

①原子指标:是事实表中,某一个字段的统计值(sum、count、max、min、avg),如下单用户数,下单金额等;

②派生指标:是基于原子指标,进行维度组合后产生的指标,如近1天商城下单用户数,本周商城黄金会员下单金额等。

原子指标无业务意义,它只是预定义的代码片段而已。业务中用到的指标基本都是派生指标。

3、接着定义原子指标与派生指标的生产逻辑
在本章的开头有提到这样一句话:“将指标的组成部分解耦拆分开来,并在逻辑表中进行规范性的定义”,这个解耦跟定义的过程,就是把一个派生指标拆解成原子指标、时间周期、限定维度、聚合粒度,然后再重新拼装,生成新的派生指标的过程:

在上面这个例子中可以这样来理解:

①统计周期是这个原子指标进行统计运算的时间范围,在这里是本周;

②聚合粒度是指标的主体,即按照哪个维度来来进行聚合,这里是黄金会员;

③限定维度是限制原子指标的计算范围,这里限定在商城,即只计算商城相关的数据;

④原子指标则是预定义的某个字段计算规则。在这里是下单金额的累加。

4、最后通过指标管理平台对指标进行规范生产

(1)规范化指标命名

命名规范对于后期大量的指标管理来说非常重要,因为当指标多起来的时候,你要找一个指标经常需要用到检索功能,而检索的前提是你对指标有一些前置的认知。这就需要我们对指标的命名进行规范化。

指标命名规范有三个重点:

①简洁明了,易懂:最好是只要看到指标名,不需要看注释就可以知道它的意思,归属等;

②格式统一:每个指标的格式都是一样的,通过组合不同模块的命名拼凑起来;

③生成统一:原子指标与继承自它的派生指标的规范是一致的。

以商城相关的指标为例:

①所有业务下单跟支付指标,默认以主单为统计口径,不用带“主单”相关字眼,如商城下单次数;当统计口径为“子单”时则需要在命名中标出,如:商城子单下单次数;

②所有与人相关指标默认以“注册用户”为统计实体,不需要带“用户”相关字眼,如访问次数;当统计主体为“游客”时则需要在命名中标出,如:游客访问次数;

③无指定业务范围的指标默认为平台指标,不需要带“平台”相关字眼,如近30天支付人数。如果有限定业务范围,则需要加上业务名称,如:商城-近30天支付人数;

④无指定时间周期的指标默认为“近1天”(但需要保存小时粒度,便于后续下钻),不需要带“时间”相关字眼,如注册人数。如果有限定时间范围,则需要加上时间周期:如:近7天注册人数。

完整的命名的规范为:商城(业务板块)+用户(实体)+近7天(统计周期)+新增(业务动作)+子单(类型)+单日(间隔周期)+平均(统计运算规则)+支付金额(原子指标),如:商城-用户近7天新增子单单日平均支付金额(没有的部位可留空,如:商城-汇总支付金额)。

⑵规范化统计口径

当指标主体为实体(名词):游客、用户、商品等,则只需定义单位为“人/个” 即可。如:游客人数、用户人数、商品个数。

当指标为业务动作(动词):如点击、支付、下单等,单位除定义为“次数” 外,还需考虑跟这个动作关联的实体的单位,如“商品”时需要定义多一个单位“笔数”;为“用户”时则需要定义多一个“人数”等;所以一个下单动作的指标,会有多个不同的统计口径:下单次数,下单人数,下单笔数,下单金额……

在定义指标名时需要详细列出,避免出现“下单数”这样模糊的指标。

⑶规范化指标等级

我们都知道,随着公司的发展,产品在不断地进行迭代,功能的增删与业务的变化势必也影响着指标的发展,一些旧的指标被不断更新或废弃,而新的指标也不断增加。这时对指标的管理也成了一个问题,哪些指标由谁开发?后续谁来维护……

一个比较好的解决方案就是对指标进行等级划分,可以划分为两个等级:

①一级指标:即原子指标与小部分全平台的核心指标,从各业务部门收集需求后,统一由数据中台来产出,有一套完整规范的开发流程:需求-评审-排期-开发-测试-验收-上线。所有维护管理工作都由中台负责;

②二级指标:即派生指标,由各业务部门自定通过指标中心生成,没有严格的开发流程,各业务部门根据需要自行创建,但需要遵守命名规范。所有维护管理工作由部门内部负责。

四、阿里体系架构

阿里体系架构

业务板块:由 于阿里巴巴集团业务生态庞大,所以根据业务的属性划分出几个相对独立的业务板块,业务板块之间的指标或业务重叠性较小。如电商业务板块涵盖淘系、B2B 系和 li Exp ess 系等。
规范定义: 阿里数据业务庞大,结合行业的数据仓库建设经验和阿里数据自身特点,设计出的一套数据规范命名体系,规范定义将会被用在模型设计中。后面章节将会详细说明。
模型设计: 以维度建模理论为基础,基于维度建模总线架构,构建致性的维度和事实(进行规范定义)。同时,在落地表模型时,基于阿里自身业务特点 设计出一套表规范命名体系。后面章节将会详细说明。

(一)规范定义

规范定义实例

名词术语

常用时间修饰词

(二)操作细则

( 1 )派生指标的种类
派生指标可以分为 事务型指标、存量型指标和复合型指标。
按照其特性不同,有些必须新建原子指标,有些可以在其他类型原子指
标的基础上增加修饰词形成派生指标。
事务型指标 是指对业务活动进行衡量的指标。例如新发商品数、
重发商品数、新增注册会员数、订单支付金额,这类指标需维护
原子指标及修饰词,在此基础上创建派生指标。
型指标:是指对实体对象(如商品、会员)某些状态的统计。
例如商品总数、注册会员总数,这类指标需维护原子指标及修饰
词,在此基础上创建派生指标,对应的时间周期 般为“历史截
至当前某个时间”。
复合型指标:是在事务型指标和存量型指标的基础上复合而成
的。例如浏览 UV-下单买家数转化率 有些需要 建新原子指标,
有些则可以在事务型或存量型原子指标的基础上增加修饰词得
到派生指标。
(2 )复合型指标的规则
比率型 创建原子指标,如 TR 、浏览 UV 下单买家数转化率、
满意率等。例如,“最近 天店铺首页 TR”,原子指标为“ CT ”,时间周期为“最近 天”,修饰类型为“页面类型”,修饰词为“店
铺首页”。
比例型 创建原子指标,如百分比 、占 比。例如“最近 天无线
支付金额占比”,原子指标为“支付金额占比”,修饰类型为“终
端类型”,修饰词为“无线”。
·变化量型:不创建原子指标,增加修饰词,在此基础上创建派
指标。例如,“最近 天订单支付金额上 天变化量”,原子指标
为“订单支付金额”,时间周期为“最近 天”,修饰类型为“统
计方法”,修饰词为“上 天变化量”。
·变化率型:创建原子指标。例如,“最近 天海外买家支付金额
天变化率”,原子指标为“支付金额变化率”,修饰类型为“
家地域”,修饰词为“海外买家”。
·统计型 (均值、分位数等):不创建原子指标,增加修饰词,在
此基础上创建派生指标;在修饰类型 “统计方法”下增加修饰词,
如人均、日均、行业平均、商品平均 90 分位数 70 分位数等。
例如,“自然月日均 UV”,原子指标为“UV”,修饰类型为“统
计方法”,修饰词为“日均”。
排名型 创建原子指标, 一般为 top_xxx xxx ,有时会同时选择
rank top_xxx _xxx 组合使用。创建派生指标时选择对应的修饰
词如下:
〉统计方法(如降序、升序)。
》排名名次(如 TOP IO )。
》排名范围(如行业、省份、一级来源等)。
》根据什么排序(如搜索次数、 PV )。
示例如图 所示。
对象集合型 主要是指数据产品和应用需要展现数据时,将一些
对象以 k-v 对的方式存储在一个字段 中,方便前端展现。比如
势图、 TOP 排名对象等。其定义方式是,创建原子指标, 般为
xxx 串:创建派生指标时选择对应的修饰词如下:
其他规则
( I )上下层级派生指标同时存在时
如最近 天支付金额和最近 PC 端支付金额,建议使用前者,
PC 端作为维度属性存放在物理表中体现。
(2 )父子关系原子指标存在时
当父子关系原子指标存在时,派生指标使用子原子指标创建派生指
标。如 PV IPV (商品详情页 PV ),当统计商品详情页 PV 时,优先选
择子原子指标。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 207,248评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,681评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,443评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,475评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,458评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,185评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,451评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,112评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,609评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,083评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,163评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,803评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,357评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,357评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,590评论 1 261
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,636评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,925评论 2 344

推荐阅读更多精彩内容