《用户画像》系列1:用户画像基础

1.1数据应用体系层级划分:


1.2标签类型:

分为统计类标签、规则类标签、机器学习挖掘类标签、自定义类型标签;

统计类标签:用户的近7日活跃时长可以从用户注册数据、用户访问、消费数据中统计得出,该类型的标签构成了用户画像的基础;

规则类标签:在实际开发画像的过程中,由于运营人员对业务更为熟悉,而数据人员对数据的结构、分布;特征更为熟悉,因此规则类标签的规则由运营人员以及数据人员共同协商而定。如经过某个业务数据流转,可以获得得到一个标签;

机器学习挖掘类标签:通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断,该类标签需要通过算法挖掘产生。

总结:统计类规则类标签用的比较常见,占系统开发的大多数,机器学习挖掘用的比较少。

1.3数据架构


用户画像是不是产生数据的源头,而是对于基于数据仓库DW、ODS、DM层中与用户相关数据的二次建模加工,在ETL过程中将用户标签计算结果写入Hive,由于不同数据库有不同的应用场景,后续需要进一步到将数据同步到MySQL、HBASE、Elasticsearch中;

解释:

(1)ETL是英文Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。

(2)ODS:操作性数据

(3)DW:数据仓库

(4)DM:数据集市

(5) MySQL:一个关系型数据库管理系统,存储元数据标签、监控相关数据,导出到业务系统的数据;

(6)Elasticsearch:一个分布式、高扩展、高实时的搜索与数据分析引擎,支持海量数据的实时查询分析,用于存储用户人群计算、用户群透视分析所需的用户标签数据(由于用户人群计算、用户群透视分析的条件转化成的SQL语句多条件嵌套较为复杂,使用Impala执行也需要花大量时间)

(7)HBase:一个分布式的、面向列的开源数据库,存储线上接口实时调用类数据

(8)FTP:文件传输

(9)Hive:存储用户标签计算结果、用户人群计算结果、用户特征库计算结果;

1.4主要覆盖模块:


1.5开发流程:


(1)目标解读:

在建立用户画像前,首先需要明确用户画像服务于企业的对象,再根据业务方需求,明确未来产品建设目标和用户画像分析之后的预期效果;

(2)任务分解与需求调研

当已经明确了用户画像的服务对象与应用场景,接下来需要针对服务对象的需求侧重点,结合产品现有业务体系和“数据字典”规约实体和标签之间的关联关系,明确分析维度。

(3)需求场景讨论与明确

数据运营人员需要根据与需求方的沟通结果,输出产品用户画像需求文档,在该文档中明确画像应用场景、最终开发出的标签内容与应用方式,沟通确认。

(4)应用场景与数据口径确认

经过上述的需求场景讨论与明确,最终实现的标签维度、标签类型后,数据运营人员需要结合业务与数据仓库中已有的相关表,明确与各业务场景相关的数据口径,需要产出产品用户画像开发文档,并且文档中需要明确应用场景,标签开发的模型,涉及的数据库与表以及应用实施流程。

(5)特征选取与模型数据落表

将已经明确的需求场景进行业务建模,写好HQL逻辑,将相应的模型逻辑写入临时表中,并抽取数据校验是否符合业务场景需求

(6)线下模型数据验收与测试

数据仓库团队的人员将相关数据落表后,设置定时调度任务,定期增量更新数据。数据运营人员需求验收数据仓库加工的HQL逻辑是否符合预期,根据业务需求抽取表中数据查看是否在合理范围内,如果发现问题要及时反馈给数据仓库人员调整代码逻辑和行为权重的数值

(7)线上模型发布与效果追踪

通过持续追踪标签应用效果及业务方反馈,调整优化模型及相关权重配置。

1.6画像体系开发主要阶段

(1)标签开发:根据业务需求和应用场景梳理标签指标体系,调研业务上定义的数据口径,确认数据来源,开发响应的标签,标签开发在整个画像项目周期中占有较大比重;

(2)ETL调度:熟路需要调度的个任务之间的依赖关系,开发调度脚本及调度监控告警脚本,上线调度系统;

(3)打通服务层接口:为了让画像数据走出数据仓库,应用到用户身上,需要打通数据仓库和各业务系统的接口;

(4)画像产品化:需要产品经理与业务人员、技术开发人员一起对接业务需求点和产品功能实现形式,话产品原型,确定工作排期,JAVA WEB端开发完成后,需要数据开发人员 面向对应的库表中灌入数据

(5)开发的优化:在画像的数据和产品端搭建好架构,能提供稳定服务的基础上,为了让调度任务执行起来更加高效,提供服务更加稳重,需要对标签计算脚本,调度脚本,数据同步脚本等相关计算任务进行重构优化;

(6)面向业务方推广应用:用户画像最终的价值产出点是业务方应用画像数据进行用户分析,多渠道触达运营用户,分析ROI,提升用户活跃度或营收。面向用户提供使用文档。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,245评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,749评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,960评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,575评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,668评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,670评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,664评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,422评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,864评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,178评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,340评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,015评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,646评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,265评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,494评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,261评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,206评论 2 352

推荐阅读更多精彩内容