如今,随着大数据和精益数据分析的普及流行,不会看数据的产品经理也不能称作合格的产品经理了。为了能够使我们的产品设计更加智能,避免拍脑袋/因果驱动的产品设计,产品经理在产品设计阶段就要考虑结合自己产品的业务目标来定义对应的数据统计指标,在产品灰度或者上线时跟踪产品运营数据的变动,分析趋势,发现问题。
然而,现在的很多公司在产品设计和运营方面常常存在如下问题:1)效率低,错过了利用数据决策的最好机会。数据工程师由于面对来自产品、运营甚至boss的数据需求,并且有些数据准备得不充分,数据来源并不好,需要重新获取数据,导致整个跑数据的流程非常耗时。2)数据分析的指标需要更加细化。例如用户流失,仅看宏观的仪表盘数据是远远不够的,要按地域、渠道等不同方式切分进行追查,看是整体量下滑还是某一个渠道出现问题造成的用户流失。
如何去研究数据,用好数据,来更好地帮助我们进行产品设计和产品迭代优化?我觉得应该从产品数据分析的目的谈起。
什么是数据
数据的四个属性包括:时间、地点、人物、事件。例如,我们要分析电商的交易数据,那么这个数据可以被细化为:时间戳、交易发生的地点、买家、购买的产品/支付价格/支付手段。
注意:真正的用户行为往往都是以事件为核心的数据。
数据分析的目的
做数据分析,必须要有明确的目的,清楚要如何通过数据来验证和得出产品迭代优化的功能点,如何通过运营和产品设计来提升转化率,增加商业变现的价值。下表列出了数据分析在产品不同阶段的关注重点。
产品阶段 | 关注重点 | 商业价值 |
---|---|---|
冷启动/增长前期 | 需求验证,功能打磨优化 考察核心指标(日活/月活/留存),理解历史数据的变化及原因,知道自己产品当前正在发生什么 |
低,目的是能够让产品跑出用户自然增长的曲线,为未来增长期提供基准数据 |
增长期 | 基于数据,预测不同类型的用户群体使用产品的行为,从产品和运营的角度提供可行解决方案,让产品有更好的拉新、转化和留存效果。 | 中,以数据驱动分方式大规模获取客户。主要以留存度为考量,专注几个核心功能点的突破,挖掘产品对于用户的核心价值。优化各个渠道,提高单位时间的转化效率。 |
业务变现期 | 在高用户基数的基础上如何做到产品的全局优化,即多个产品线,多个维度(价格、营销、产品设计、销售)如何找到最好的平衡点,实现利益最大化。 | 高,对转化漏斗的每个环节持续追踪,做好精细化的数据运营。通过市场营销、产品改进、客户运营等多种方式来协同提升付费和营收。 |
数据分析的方法
数据分析的第一步是收集数据。收集数据就要做好数据埋点,即在应用的功能逻辑代码中添加统计代码,统计出我们所需要的指标数据。目前主流的数据埋点要么是自己加入统计代码并搭建自己的数据查询分析后台,要么是接入第三方统计平台的SDK,在移动应用方面,国外多采用Google Analytics,国内基本采用的是友盟。这一两年国内也出现了许多新的移动应用数据统计的创业产品,例如GrowingIO和诸葛IO,其统计精确度和易用性还有待市场验证。
收集完应用数据后,一般会根据运营或产品部门所定的产品指标分别输出各种统计报表,但分析不能只仅仅停留在报表的基础,还要输出成产品或运营优化的方案和措施。因此,大部分互联网公司现在除了分析业务数据的报表以外,还陆续引入大数据BI分析或者机器学习平台,建立一套智能分析的数据科学框架,用于辅助员工进行决策和改进产品。
产品数据分析的层次
对产品用户和行为数据的研究自顶向下可以分为三个层面,宏观层、中间层和微观层。
宏观层
宏观层由一系列的产品数据指标构成,这些基本的数据指标可以从多个方面来帮助我们把握产品的设计合理性和运营情况。
(一)用户规模和质量
一款产品的用户规模和质量大致可以从新增用户、活跃用户、用户构成、用户留存等几个方面来评估分析。
新增用户指标
指标 | 指标说明 |
---|---|
新增用户 | 第一次启动应用的用户(以设备为判断标准,即一个用户以ipad和iphone分别启动用户,算两个新增用户) 用于衡量营销推广效果的指标 |
新增用户占比 | 某时段内新增用户占该时段活跃用户的比例。 用于衡量产品的健康度。占比太高,有可能用户基本靠运营活动拉来的,没有沉淀,流失风险大。 |
活跃用户指标
活跃用户是指某个时间周期内,启动过应用的用户(去重)。启动过一次的用户即视为活跃用户,包括新用户和老用户。该指标用于衡量用户规模和质量。
活跃用户一般是按设备来统计的,统计一个周期内启动过设备的数量。
指标 | 指标说明 |
---|---|
日活跃用户(DAU) | 当天启动过应用的用户(去重),可分为自然日(当天凌晨0时至当晚24时)和营业日(当天凌晨6时到次日凌晨6时),按营业日计算一般是考虑到某些线下支付业务需要与商家对账的考虑。 |
周活跃用户(WAU) | 当周启动过应用的用户(去重),周区间定义为周日至次周周六 |
月活跃用户(MAU) | 当月启动过应用的用户(去重) |
活跃用户占比 | 某日/周/月的活跃用户占所选时间段总活跃用户的比例,例如 昨日活跃/过去7天活跃,或者 昨日活跃/过去30天活跃 |
月活跃率 | 月活跃用户占截至当月累计用户的比例 |
沉默用户 | 用户仅在安装日(及安装次日)启动,且在后续时间内无启动行为。 该指标可以反映出新增用户的质量以及与应用的匹配度。 |
需要注意的是,要根据产品的属性来重点关注日活、周活还是月活,像新闻、社交、音乐这样的高频应用,日活是重点考察的指标,月活则相对权重小一些。
用户构成指标
指标 | 指标说明 |
---|---|
活跃用户构成 | 某日/周/月活跃用户中新用户与老用户的分布。 用于判断产品的健康程度。 |
本周回流用户 | 上周未启动应用,本周启动应用的活跃用户 |
近期流失用户 | 连续n周(1<=n<=4)没有启动过应用的用户 |
周活跃用户 | 当周启动过应用的用户(去重) |
连续活跃用户 | 连续活跃2周以上的用户 |
连续活跃n周用户 | 连续n周,每周至少启动过一次应用的活跃用户(第n+1周没有启动) |
忠诚用户 | 连续活跃5周及以上的用户 |
我们一般将用户分为新用户和老用户,主要关注流量和转化率两块内容,通过渠道引流拉新来的新用户需要转化为老用户,老用户则会留存或流失。如果老用户发生了流失,那么一般需要通过推送、活动(积分、签到、任务)、发布新版本等方式,提升内容质量或者功能特性来吸引回流用户。
用户留存率指标
用户留存率一般是用来衡量应用对用户吸引力的重要指标。一般情况下,3日留存率移动游戏最高,7日留存率一般是所有留存里下降最多的。如果一个应用的留存率发生了较大变化,可能的原因一方面是推广渠道的变化使得用户质量产生了变化。
指标 | 指标说明 |
---|---|
次日留存用户 | 下载启动应用后的第2天仍然使用应用的用户 |
3日留存用户 | 下载启动应用后的第4天仍然使用应用的用户 |
7日留存用户 | 下载启动应用后的第8天仍然使用应用的用户 |
14日留存用户 | 下载启动应用后的第15天仍然使用应用的用户 |
月留存用户 | 下载启动应用后的次月第1天仍然使用应用的用户 |
除了以上几类的指标外,还有一些指标也可以用于衡量应用质量,例如每个用户总活跃天数指标,这个指标是统计平均每个用户在应用上活跃的天数(通常以年为单位),反映了用户流失之前在应用上耗费的天数,用于衡量用户活跃程度和质量。
(二)参与度分析
衡量用户参与度主要从PV/UV、启动次数指标、使用时长、使用时间间隔和访问页面几个维度来考察。
PV/UV
PV指页面访问量,UV指唯一访客量(用户去重,记录cookie)。
启动次数指标
既要关注总体趋势,也要关注平均启动次数,通常和人均使用时长以及日活跃用户数关联起来分析活跃用户对产品的参与度。
指标 | 指标说明 |
---|---|
总启动次数 | 打开应用视为启动,完全退出或退至后台即视为取启动结束。根据产品实际情况,一般统计日启动次数(社交)或周启动次数(在线教育或娱乐)。 |
人均启动次数 | 总启动次数/活跃用户 |
使用时长
用于衡量产品活跃度和使用质量的。单次使用时长长说明产品用户黏性比较好。
指标 | 指标说明 |
---|---|
人均使用时长 | 一定周期内的应用总使用时长/活跃用户 |
单次使用时长 | 一定周期内的应用总使用时长/启动次数 |
访问页面
用户一次启动内访问的页面数。通过比较不同访问页面数对应的活跃用户分布,可以发现页面设计上可能存在的问题以及可以优化体验的功能点。
使用时间间隔
使用时间间隔是统计同一个用户相邻两次启动间隔的时间长度。在固定的查询时段内只启动过一次的用户记为首次。使用时间间隔的统计是为了还原使用场景。
(三)渠道分析
对渠道推广的用户质量进行评估,分析用户行为是否正常(使用时长、使用机型、使用时间),研究推广渠道所带来的用户的真实性和质量。
(四)用户属性分析
设备终端分析(消费者层级分类定位)android/iphone端的活跃用户、新增用户、启动用户
网络及运营商分析(wifi/3G/4G,移动/联通) 活跃用户、新增用户、启动用户
地域分析 按省市划分的活跃用户、新增用户、启动用户统计
用户画像分析 包含多个维度,例如自然属性(性别、年龄、学历、收入、支出、职业、行业)、个人兴趣(音乐、电影、健身、宠物)、商业兴趣(房产、汽车、金融)。需要建立数据平台对大量数据(用户路径、用户行为)进行整理标注,同时配合用户访谈。
中间层
中间层由一系列相互关联的分析方法、模型以及相应的数据构成。常见的如漏斗分析、AARRR分析、交叉分析、用户画像等。
漏斗分析
漏斗分析一般是用于产品各个关键路径转化率的分析。我们为产品定义若干关键路径,通过用户从进入页面到最终完成操作这个过程中用户数量的变化趋势,来发现产品功能设计上的问题以及流程上的复杂性,再有针对性的去优化和改善。
AARRR模型分析
AARRR(Acquisition、Activation、Retention、Revenue、Refer)是硅谷目前比较流行的产品数据分析模型,分别是指获取、激活、留存、收入和推荐。
交叉分析法
通常是把纵向对比和横向对比综合起来,并对总体数据指标进行细分,对数据进行多角度的结合分析。例如,我们可以将移动端的新增用户按Android和iOS进行平台划分,同时结合月份分布进行交叉分析。
4月 | 5月 | 6月 | 总计 | |
---|---|---|---|---|
iOS | ||||
Android | ||||
总计 |
同时我们可以将Android端的新增用户按渠道进行二次划分,这样对于各渠道的用户增长就一目了然了。
渠道 | 4月 | 5月 | 6月 | 总计 | |
---|---|---|---|---|---|
iOS | App Store | ||||
总计 | |||||
Android | 预装渠道 | ||||
市场渠道 | |||||
地推渠道 | |||||
广告渠道 | |||||
总结 |
微观层
由产品中每个用户及其行为的细节数据构成。包括页面埋点、事件埋点、功能活跃指标、页面访问路径等。这些数据可以让我们去深入的了解和理解每一个用户以及用户的行为。
数据驱动的产品优化流程
主要分为以下几个步骤:
- 分析当前的数据(宏观层的各类指标,把握产品运营的整体趋势),重点看活跃用户和留存率。针对一些新功能,也需要定义新的指标。
例如,我们要验证产品的新功能上线的运营情况时,我们就需要关注用户活跃比例,即使用新功能的活跃用户数/同时间段活跃用户数。同时我们也要关注用户是否会重复使用新功能,衡量指标是重复使用比例,即第N天继续使用新功能的用户数/第一天使用新功能的用户数。 - 找到目前存在的关键问题,并且思考如何改进。
对存在问题的宏观数据指标进行深入剖析,使用中间层的漏斗分析和AARRR模型分析,定位问题存在的流程步骤。必要时需要深入微观层分析用户页面访问路径和相关的细节行为,直到对问题原因得到清晰的认识。总体上问题的原因可以分为用户本身的原因和系统设计的原因,用户本身的原因可以通过引导、教育和回访来解决,系统设计的原因就要通过迭代来优化交互或者简化流程。 - 定义核心的转化指标。
- 带着有效猜测和假设进行改进,马上实验。
- 迅速分析结果,得出结论。
- 改进产品,或者继续保持现有的方案。