一、什么是用户画像
用户画像是真实用户的虚拟代表, 是建立在一系列真实数据之上的目标用户模型。
数据化已经成为时代的趋势,而能使用到数据化研究用户,对用户的认知将会更加清晰准确,用户画像是大数据时代的一项应用;
用户画像作为大数据的根基,根据用户社会属性、生活习惯、消费行为抽象出的一个虚拟的用户模型,它完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础,奠定了大数据时代的基石。
用户画像(User Profile)的定义:用户画像就是给用户打标签,通过标签完美地抽象出一个用户的信息全貌。用户画像可以看作企业应用大数据的根基。
如:女,浦东新区,超市购买果粒鲜酪乳,等待这样一串描述即为用户画像的典型案例。
如果用一句话来描述用户画像,即:用户信息标签化。
一个标签通常是人为规定的高度精炼的特征标识,人制定标签规则,并能够通过标签快速读出其中的信息,如:年龄段标签:25~35岁,地域标签:北京。
标签呈现出两个重要特征:语义化,短文本。
语义化指的是人能很方便地理解每个标签含义,这也使得用户画像模型具备实际意义,能够较好的满足业务需求。如,判断用户偏好。
短文本指的是具有完整、系统含义(Message)的一个短语,如80后、白领、喜欢海淘、常看电影。这是为利用机器提取标准化信息提供了便利,机器方便做标签提取、聚合分析。
所以用户画像,即:用户标签,向我们展示了一种朴素、简洁的方法用于描述用户信息。如果用一幅图来展现,即表现形式,包含了标签图&后台画像图&用户基础信息
用户的整体画像分析
单个用户的画像数据
用户画像的本质是对用户数据的统计与分析,最终以通俗易懂的方式呈现出来,以供业务人员方便的使用;
二、用户画像的作用
通过标签可以让计算机识别信息,将人的行为信息进行程序化处理,方便计算,通过分类统计计算、聚类分析、关联分析可以进一步了解人的行为动机,进而用于搜索引擎、推荐引擎、广告投放等功能的优化,提升精准度,提升信息获取效率。那用户画像的作用我们可以总结为四点:
了解用户,知道用户是谁,用户喜欢什么,用户在哪,从而服务用户;
完善产品运营,提升用户体验,改变以往闭门造车的生产模式,通过事先调研用户需求,设计制造更适合用户的产品,提升用户体验。
对外服务,提升盈利点,根据产品特点,找到目标用户,在用户偏好的渠道上与其交互,促成购买,实现精准运营和营销。
数据挖掘,业务经营分析以及竞争分析,影响企业发展战略;
三、如何构建用户画像
企业在选择构建用户画像平台,可以实现不同的战略目的,如提升产品服务质量、精准营销等。根据战略目的的不同,用户画像的构建也有所区别。因此首先需要明确用户画像平台的战略意义、平台建设目标和效果预期,进而有针对性的开展实施工作。
构建用户画像的三个基础步骤::基础数据采集->行为数据建模->构建画像;
基础数据采集
数据是构建用户画像的核心依据,构建用户画像是为了还原用户信息,因此数据越多越全面越好,所以没有客观数据的用户画像是没有价值的。
用户画像数据的来源可以来自企业内部包含企业本身掌握的用户及网站前后台的访问数据(一般存储在公司的大数据平台),企业内部资料等,以及外部,包含问卷、访谈、行业报告、文献、第三方数据公司等渠道;
有了数据就要对数据进行分类,用户画像就是给用户行为打标签,最终为用户的每一个行为打上标签和权重。标签是为了表达用户的特征如兴趣爱好等,同时也方便理解和统计。权重代表了用户对这一个标签的喜好度或需求度,权重越高说明标签的特征越明显。
用户画像里常见的标签可以分成两大类别,相对静止的用户标签,即静态标签,以及变化中的用户标签,即动态标签。
静态标签主要从用户的基本信息进行用户的划分。静态属性是用户画像建立的基础,最基本的用户信息记录。如性别、年龄、学历、 角色、收入、地域、婚姻、 性格等。
动态标签指用户在在互联网环境下的上网行为。信息时代用户出行、工作、 休假、娱乐等都离不开互联网,动态标签能更好的记录用户日常的上网偏好,通过动态标签我们能更好的理解用户的变化的行为偏好,而为用户提供服务。
标签的定义要基于业务场景进行分类,不同行业的标签会有所区别,数据分类如下
基础数据:
年龄
性别
职业
地域
星座
血型
兴趣爱好
婚姻状况
消费能力
消费周期
消费偏好
业务数据
注册时间
用户等级
活跃度
使用时长
使用频次
行为特征
内容型产品标签:
浏览
收藏
评论
互动
点赞
转发
内容偏好(科技、经济等)
交易型产品
浏览
加车
购买
支付
品牌偏好
单价
购物频率
社交型产品
好好友
互动
关注/取关
邀请
新建群
加入群
对用户相关数据的分类,可以尝试多种方式,关键在于根据应用场景、业务场景需求的不同而不同,按需划分。
用户标签数据不用一次性就做完整,但在定义时能够分类清晰,并具备可扩展性,通过后续的不断枚举并迭代补充遗漏的信息维度就可以。
行为数据建模
作为产品经理不需要去实现模型,需要我们去定义如何计算
当我们对用户画像所需要的资料和基础数据收集完毕后,需要对这些资料进行分析和加工,提炼关键要素,构建可视化的用户模型。用户的一次行为事件包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。通过这四个维度我们可以计算出用户的行为偏好,进而建立模型。
什么用户:也就是用户标识,首先要做好标识,用户标识的目的是为了区分用户、单点定位,否则就不知道是谁在发生行为。
以上列举了互联网主要的用户标识方法,获取方式由易到难。视企业的用户粘性,可以获取的标识信息有所差异。
什么时间:就是为了标识用户发生行为的时间点,时间维度包含了时间点和时间长度,时间点在技术上通常用时间戳来标记,时间戳可以精确到秒或毫秒,标识用户的行为发生时间。时间长度是标识用户在某一页面的停留时间,停留时间的长短和用户的行为偏好有直接关系,停留时间越长,用户对该页面的信息越感兴趣。
时间长度 权重
1-10分钟 1
10-30分钟 2
30分钟以上 3
什么地点:也就是用户是在什么地方访问到你的产品的,也就是接触点,接触点包含两个信息:网址+内容。
网址:一个URL链接,也就是你的产品的某个页面,不同的页面内容会有不同权重,页面的内容决定了权重。比如用户在购物时分别浏览了耳机、手机、电脑是三个网页,这就是对应标签,然后设定权重,
标签 权重
耳机 1
手机 2
电脑 3
做什么事:是指用户在产品上发生的行为,如电商的的行为有浏览、添加购物车、搜索、评论、购买、点赞、收藏等,不同的行为类型所代表的的权重不同,如:
标签 权重
浏览 1
购买 2
综合以上的标签权重,通过计算公式:用户标识+时间戳+时间长度+网址&内容+行为类型+权重,计算获得用户的得分,然后定义用户是否试用于某个标签。
标签:喜爱电子产品,
分值策略:30天内用户得分>60时,电子产品达人标签生效;
应用:向标签为喜爱电子产品的用户,权重>80的用户推送新的iphone手机;
该计算方法也仅仅只是一个初级的引入,供大家理解用户画像数据的计算基本方法,真正的大数据画像的计算是相当复杂的,比如还会考虑到:时间衰减因子、商品价格权重、用户等级权重、递增计算等等,但如何计算都是从以上基本的公式中演化而来的,逐步细化模型,由小到大,由粗放到精细去设计完善,同时对用户画像进行数据建模,结合实际的业务需求,找出相关的数据实体,以数据实体为中心,分析数据维度类型和关联关系,形成符合客户实际情况的建模体系。
画像呈现:
用户画像的呈现,要基于业务需要具体呈现,同时针对不同角色人员的需求设计不同的应用,用户画像会应用于搜索推荐、广告投放、产品设计等,比如基于上述的计算,我们可以发现用户A生活在北京,收入在1W左右,网购周期为1月两次,消费能力为1000元/次,多为电子产品类消费,那就想用户推送最新的电子产品;
我们构建用户画像的目的是为了充分了解我们的用户,进而为产品设计和运营提供参考。因此用户画像对于企业和产品发展至关重要,用好用户画像意义重大。