这次分享的主要内容是用户群体兴趣的可视化
用户的兴趣还是来自用户的搜索数据,
以用户的搜索词能够表示用户兴趣为前提,以用户搜索类目的频次为权重,给用户打上兴趣的标签。
提取搜索过某几个品牌的全部用户,提取用户的标签列和权重。
揭示用户兴趣和品牌的关系的主要方法是对应分析。
简单的介绍一下对应分析
对应分析广泛用于对由属性变量构成的列联表数据的研究,对应分析能够在一张二维图上,同时画出属性变量不同取值的情况,列联表上的每一行每一列都用二维图上的一个点表示,将各个属性变量之间的相互关系用简单直接的方法表示出来。
用成熟的统计软件就能够完成,比如R、SPSS 输出图和坐标
例如输入的数据是
单价 销量 品种 颜色
A 1000 10 5 2
B 1200 100 10 2
C 800 1000 1 1
会输出一张ABC与单价、销量、品种、颜色的气泡图
在图中,通过两个点的距离来判断距离,如 C与销量会最近
当然这只是我探索可行性的一次尝试,兴趣的具体内容、粒度,品牌的粒度都需要再研究。
因为人群越细分(如同一行业同类垂直细分的竞品品牌人群),其偏好越有相似性,除非有极大量数据的支持,不然很难有明显的区分,或者是得到的结论是失真的、难以解释的。但是现在我们的系统的数据量还不多,精细化就很难做到。而且对于垂直细分品牌本来就只有少数的用户群体,对于做这个分析都是不利的。