【用户行为采集】(三)埋点管理系统

用户行为数据采集──埋点,是用户行为分析中非常重要的环节,直接决定数据广度、深度、质量,影响后续所有的环节。就埋点本身来说,技术实现的难度并不高,但是整个埋点的过程可以说十分的复杂繁琐,有非常多细节和流程需要考虑,不同类型客户端如何采集,数据如何统一,哪些信息需要在客户端采集,哪些信息需要在后端采集,如何减少数据上报的延时和漏报,如何对成千上万个埋点进行统一的管理?
这一系列文章基于用户行为分析数据平台一年的工作经验,会对埋点的全过程进行思考和讨论,涉及对埋点基础知识的介绍,讨论如何从 0 到 1 开始用户行为数据采集工作,分享负责项目的埋点方案,介绍埋点管理系统,梳理整个埋点协作流程等方面。
上篇文章讨论了为何、以及如何建立用户行为数据采集规范,点击查看。本文是系列文章的第三篇,介绍如何将采集规范线上化──埋点管理系统。

为什么要做埋点管理系统?

就埋点本身而言,并没有什么技术挑战,但涉及的环节特别多,包括埋点需求提交、埋点设计(定义采集字段、格式、采集时机、上报策略)、埋点开发上线、无用埋点下线等等,这些环节都需要一个有效的流程串联起来,在上一篇文章中建立了采集规范,已经有了这样的流程。但这还不够,因为整个流程需要多个团队协作,如业务团队、数据团队、埋点研发团队(又包括后端埋点,不同端的前端埋点,如 iOS 端、Android 端、Web 端、微信小程序端等),各团队按照规范各司其职、相互配合,如果这些都要靠人「自觉」的协作,那要付出巨大的沟通成本。在实际的工作中,人的「自觉」几乎是不可能的,因为每个角色处在不同的环节上,只会去寻找「局部最优」。所以,我们希望让「系统」来做协调的工作,通过将流程线上化到系统中去,各个团队都到系统中去处理自己负责的事项,使得各环节的输入输出更加的标准化、自动化,以此减少不必要的沟通,提高效率。这就是为什么要做埋点管理系统。

埋点生命周期管理

完善的埋点管理应该覆盖埋点的整个生命周期,包括埋点需求阶段、埋点实施阶段、埋点使用阶段(数据分析),以及埋点下线回收。
使用埋点管理系统上线埋点应该经历如下流程:


埋点管理流程

埋点管理系统参与了埋点的所有环节,各个团队/角色通过埋点管理系统完成以下工作:

  • 业务团队(有埋点需求的团队):
    • 注册埋点:埋点方案评审之后,满⾜业务需求的埋点信息被确认,包括埋点名称、属性名称、属性数据类型、属性含义、采集时机等。业务团队埋点负责人需要登录埋点管理系统注册埋点,完善相关信息,后续将以此为依据进行研发工作;
    • 埋点属性管理-自定义属性:自定义属性相对于通用属性,是某个事件下特有的属性,由业务方根据埋点方案在系统中维护;
    • 埋点信息查看/编辑:埋点上线之后,需要查看埋点信息来进行数据分析,另外,埋点信息有变化时还需要进行编辑更新;
    • 埋点回数状态查询:埋点上线之后,业务团队需要验证最初需求计划埋点以及属性是否都已上报了数据;
    • 埋点回收:过期的无用埋点需要进行下线操作。
  • 数据团队:
    • 埋点属性管理-通用属性:通用属性是指产品/业务层面的公共属性,为避免相同属性出现不同定义,数据团队需要进行统一的定义和管理;
    • 监控埋点数据上报:在埋点上报之后,数据团队需要时时了解数据上报的情况,监控异常。
  • 埋点研发测试团队:
    • 埋点信息查询:查询埋点信息,按照需求方录入埋点信息进行开发测试;
    • 监控埋点数据上报:在埋点上报之后,研发团队需要时时了解数据上报的情况,如出现异常情况,需要及时介入解决。

埋点管理功能设计

通过整理上述的埋点管理流程,以及各种角色的诉求和职责,我们梳理出了埋点管理系统应该覆盖的功能,分别是:埋点管理、埋点属性管理、上报埋点数据监控。

埋点管理

埋点列表
埋点注册之后将会进入埋点列表,埋点列表提供比较完善的埋点信息,同时也是编辑埋点、查看埋点数据上报统计的入口。

埋点列表

注册/编辑埋点信息

注册/编辑埋点信息

埋点需求确认之后,将新的埋点录入埋点管理模块,需要完善的信息包括:

  • 埋点基本信息,包括埋点名称、显示名、在线周期、可见性(设置为不可见的埋点会自动被设置为隐藏,所有分析功能都不能使用)、业务负责人、开发负责人、覆盖客户端(产品可能涉及多种客户端,如iOS、Android,需要说明哪些端会上报这个埋点),以及额外的备注信息。
  • 通用属性:数据团队维护了产品/业务层面的公共属性,注册埋点时,需要选择埋点要包括哪些通用属性。
  • 自定义属性:埋点下特有的属性,有需求方按照评审内容进行添加,需要填写埋点名称、显示名、字符类型、可见性、覆盖端等信息。

埋点回数状态
查看需求计划中的埋点以及属性在各端是否都已触发(上报数据)。

埋点回数状态

埋点回收
完整的埋点生命周期应该包括下线无用埋点,埋点回收功能将不再使用的埋点移到回收站中。埋点被回收后,历史数据依然可查询,但后续将不在接收该埋点的上报数据。用户可以通过移出回收站,恢复接收上报数据。

需要特别说明,这样的设计是出于业务特点的考虑。在用户行为分析系统的初期,我们定义了埋点的规范,但并未将整个规范流程线上化,只做了简单「埋点启用/禁用」功能,来控制埋点是否可以查询到。随着业务的发展,埋点个数在短短的时间内激增到了上万个,其中非常多的埋点上报后从来没有被查询过,有的埋点被禁用了很长时间,但一直在上报数据。后来经过盘点,实际上只有 15% 左右的埋点有过查询记录,而这些无用的埋点占用了大量的计算资源,也增加了埋点数据查询的难度(毕竟要从上万个埋点里找出关注的埋点不是一件容易的事)。基于这样的背景,我们添加了僵尸埋点过滤的功能,将首次上报后 3 个月未启用的埋点、禁用后的埋点过滤掉,即这些数据不会进入用户行为分析平台的计算引擎。功能上线后,做了简单的统计,大概能够节约 30% 的计算资源。

后来,我们做了埋点管理功能,将整个规范流程线上化。埋点管理中仍然保留了僵尸埋点的过滤策略,并做了进一步的优化。比如用户在注册埋点的时候,可以选择埋点的在线周期是长期在线还是到某一天就自动下线回收。并且,我们要将埋点可查询和埋点可接收做了分离:通过操作埋点及属性的可见性,控制数据是否可查询;通过将埋点移入/移出回收站,控制是否接收数据上报。

埋点属性管理

在埋点元数据中维护产品/业务层面的通用属性,由数据团队统一维护,所有可见的属性,都可以在注册/编辑埋点是添加属性时搜索到。自定义属性相对于通用属性,是某个事件下特有的属性,由业务方根据埋点方案维护。


埋点属性管理

上报埋点数据监控

我们可以在埋点管理中看到具体埋点的数据上报情况,监控异常。


上报埋点数据监控
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,384评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,845评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,148评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,640评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,731评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,712评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,703评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,473评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,915评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,227评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,384评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,063评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,706评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,302评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,531评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,321评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,248评论 2 352

推荐阅读更多精彩内容