浅谈群组分析(Cohort Analysis)之于产品运营的价值

作者:闫鹏(个人公众号:yanpeng-info),转载请注明作者及出处。

一、何为群组?

8月份A渠道导入的新用户们是一个用户群。

系统版本为iOS10以上的用户们是一个用户群。

加入购物车却没有完成付款的用户们是一个用户群。

曾有过消费行为却连续7天以上未登录的用户们是一个用户群。

……

我们可以根据分析需要划分出无数个用户群。(当然全体用户也是一个用户群)

二、使用群组我们可以做什么?

1.归因

产品数据无论是变好还是变坏,我们都应找出其原因,找出变好的原因就可以让它变得更好,找出变差的原因就可以让它停止变差。

而产品数据的关注点往往在用户身上,比如用户的活跃度、留存、付费率等。

因此数据的波动也往往是某些用户群体导致的,我们要找出这个群体,找出数据波动的原因。

那么最简单的方法就是分组看数据(group by),举个简单的例子:

用户流失率升高了,怎么归因?

首先要知道我们的用户在不同维度下都可以分成多组:性别维度分男女,年龄维度分老少……

而各组用户的数据趋势往往是不同的,也就是说数据的变化是非均匀分布的。

那么,如果我们以用户来源作为维度来分组看数据,我们就可以知道是不是某些渠道的用户出了问题。除此之外,我们还可以以产品版本为维度、以用户的操作系统为维度、以用户的网络环境为维度、以用户的对产品的使用进度为维度、以用户具体行为为维度(如通过是否触发(或完成)过某行为将用户分为两组;也可以用多个行为将用户分为多组)……

回到例子中(以游戏产品举例,其他产品同理):

我们先以渠道作为维度,发现各渠道趋势相似,无明显差异。那么,我们就更换维度。

这次,我们以产品使用进度为维度,发现只有等级为5的用户流失率随时间的推移上升明显;

我们再以用户行为为维度,发现完不成5级的主线任务是5级流失率上升的主要原因;

再以行为为维度,发现没有获得道具X是未完成5级主线任务的主要原因;

再以行为为维度,发现没有去地图N是未获得道具X的主要原因;

……(如此一步步归因到最后)

最终,我们发现是产品的引导做得不够明晰,用户不知道要去地图N才能获得道具X。

可以看到,通过这样分组观察数据,我们可以较容易地找到数据变化的原因所在。

另外,再次提醒:在整体数据趋于稳定的情况下不应大意,此时有可能是一部分用户群的数据正在变好,另一部分用户群的数据正在变差。

2.精准观测目标用户

我们做产品是有目标人群的,我们做功能优化、活动策划往往也是有目标用户的。我们要明确地知道目标用户是谁,他们之前和之后的数据是怎样的,才能评估产品改版或活动执行的效果,而如果我们仅通过观测整体数据来衡量,则效果往往不明显,因为数据会被冲淡和干扰。

3.精细化运营

不同用户群的需求往往是有差异的,因此一视同仁不如各给所需。

还有一类特殊的用户群体,我们称之为高价值用户,二八定律大家都知道,显然我们应该找出这20%的人,并重点服务好他们。

4.对比分析

很多时候,我们看单一群体的数据是不容易发现问题的。

比如,我告诉你某APP第二季度男性用户贡献收入1000万元,你觉得是多还是少?你可能会觉得条件不足,无法判断。

如果我再告诉你它同比增长15%,环比增长10%呢?通过对比不同时段的群体,你可能会觉得它的増势还不错。

如果我再告诉你其女性用户贡献收入3000万元,同比增长60%,环比增长30%呢?通过对比不同性别的群体,你会了解到这两个群体的差距越拉越大。

这就是数据对比显而易见的意义。

在其背后我们可以考虑两个群体差距拉大的原因是什么?是否符合产品预期与定位?未来是期望继续拉大差距(专精)还是缩小差距(平衡)?

我们最常用也是最简单的用户群对比就是“同期群对比”,包括同比和环比。

“同期群”简单来说就是以时间起点为唯一变量(时间长度相同,其他条件也相同)的多个用户群。

用中秋假期(3天)的用户活跃数据对比端午假期(3天)的用户活跃数据,就是简单的同期群对比。

比“同期群对比”高级一点的是“同期群分析”,区别在于前者对比的是“点”数据,后者对比的是“线”数据。也就是说“同期群分析”会对比多个同期群随着时间而发生的数据变化。

最常用的同期群分析就是留存分析,比如8.20、8.21、8.22三天的新增用户构成了3个同期群,查看并对比他们在各自随后七天的留存率变化就是一个简单的同期群分析。我在3年前写的一篇关于LTV分析的文章用的也是同期群分析的方法。

同期群分析的主要目的在于通过对比来发现出现问题的“群”,通过优化产品,我们期望“新群”的数据能够总是好于“老群”。

同期群的分析只是群组分析的一个典型案例,除了时间,我们还有很多划分群组的维度,也可多维度组合,如一线城市的互联网从业者对比二线城市的互联网从业者。

在BI系统的所有数据展示区域,我们都可以加上用户群对比的功能,以查看并分析不同用户群体在不同数据指标上的表现差异。

5.群画像分析

将用户群体的属性分布逐一展示出来,就是群体画像。

通过群画像,我们可以了解到指定用户群的年龄分布、性别分布、等级分布、设备品牌分布、活跃度分布等等。

通过观察和对比群体画像,我们可以了解到自己对目标用户群体的定位是否精准,以及该往哪个方向调整。

三、系统实现

没有成熟的系统支持,群组分析的门槛和成本其实还是有些高的,需要手动取数和作图,而这部分工作其实是可以交给程序来完成的。

那么,系统实现的难点就在于如何帮助使用者简单地拼装sql语句进行数据的提取,以及如何做好数据的可视化。

具体实现方法我之后会单起一篇文章简单谈一谈。

闫鹏,微信(QQ):11345191,博客:www.yanpeng.info

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,290评论 6 491
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,107评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,872评论 0 347
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,415评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,453评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,784评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,927评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,691评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,137评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,472评论 2 326
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,622评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,289评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,887评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,741评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,977评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,316评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,490评论 2 348

推荐阅读更多精彩内容