兴趣推荐系统
1.什么是推荐系统
简单来说,推荐系统就是一个负责把内容推荐给用户的系统。最早期的内容站点,可能就是把数据放在那里,用户自己去看,因为内容就那么多,每个人看到的都是一样的,这时候的推荐是针对所有人。后来内容变多了,开始有了分级菜单,有了门户站,各种内容站点开始分化,催生了诸如hao123这样的菜单网站帮助用户去收集常用网站,此时推荐基于既定的有某些固定兴趣的群体。那之后有了搜索,用户可能已经不满于分级菜单,毕竟到了最低级依然有很多内容,自己很难找到想要的,于是开始有了搜索引擎,用户自己去进行搜索,根据自己的需求去请求,此时的人群得到了更详细的划分,你输入不同的关键词,就可以给出结果,不同的人输入不同的关键词结果是一样的,此时的内容推荐已经达到了一个较细的粒度,但是是一种目标性推荐。可是如今呢,或许用户对搜索出的内容也已经感到太多,太繁杂,太千篇一律,于是,升级到了个性化推荐系统,每个人看到的内容都不一样,而且用户不需要绞尽脑汁去思考要输入什么关键词,你只要去使用就好了。
2.为什么要有推荐系统
a.设备的更新。
在pc时代,推荐或许还没有那么强烈,尤其是对于一些内容站点。就拿我们新闻网站来举例子吧,电脑显示器是很大的,直接在浏览器看新闻就好了,打开网站可以显示很多内容,把今天最火的内容全放在首页那也是没问题的。比如下面是一个新浪新闻首页截图,先是一个搜索框,接着是导航栏,再往下是正经新闻区,可以下拉,最起码有几百条内容展示在首页上,覆盖热点足够了,有些不热但优质的内容也能够得到展示,而且各个类型的新闻,包括娱乐,体育,时政,军事,教育,科技等等都有自己的一席之地,只要稍微动动手,所有内容一览无余。
下面我们再来看一张新浪新闻的app首页。都有些什么内容?一个搜索框,4条新闻,两条还是置顶的,不能动,一条热点的推送,一条其他新闻,还有半条广告。就这么少的内容。如果赶上视频,那一页只能显示两条,图文一页只能显示3条,而且你总得给广告留点位置,不然还怎么吃饭。所以呢,要提高用户阅读量,满足用户需求,那只能想想办法。用户在泛阅读中是不会给你下拉几百条看看有没有自己喜欢的内容的。那需要花费好多时间, 下拉一次没内容,再下拉还没有一点想看的,那估计就凉凉了。推荐就是为了解决这种问题,能够从广阔的内容库中计算新闻跟用户的匹配程度,然后根据每个用户对内容进行排序,这样每个人看到的内容都是经过了筛选的符合你口味的内容了,能够让你在有限的版面内,有限的用户行为内尽可能看到想看的内容。
b.数据量的暴涨。
刚才也说了,过去的内容源是很少的,一天也没有多少大事发生,小编一天一人能写一篇文章么,完看比较悬。那会儿都依赖这些专业人士来写新闻,数据量不高。现在呢,各种网站应运而生,各种内容也开始极大的丰富。多媒体也早就了各种内容源的产生,自媒体的开放也降低了内容生产者的准入门槛,谁都可以来写上几笔。新闻,或者叫泛阅读开始由PGC模式转向UGC模式。大量的段子,搞笑,小视频,迎合大家的低级趣味的内容如雨后春笋般生长。当然,那些高端,学术,专业的内容也开始有了更多生产者,但是相比之下发展比较缓慢,毕竟这个世界还是喜欢俗闻的多,况且在泛阅读这个概念笼罩下,更多的是一些消遣。内容太多了,也是很麻烦的,这就要有选择的去看。但是泛阅读又不可能让用户自己去搜索,这里面的目的性是很弱的,所以个性化推荐在这个场景中还是很适用的。
3.一个好的推荐系统
a.预测用户行为。
不管是用用户行为分析,还是用内容兴趣分析,不管是社交网络分析还是上下文分析,一个好的推荐系统首先就是去猜,猜用户的行为,用户会不会点击,会不会购买,猜对赢,猜错输。
b.挖掘用户兴趣。
但是光会猜还不行,还要帮用户拓展兴趣。比如我爱摄影,那我买相机几乎是一个100%的行为了,给我推荐相机商品,其实意义不大。因为不管它推荐不推荐,我都会买。给我推荐相机周边,比如三角架,闪光灯,滤镜片,这算是一种比较靠谱的挖掘,具备较强的关联关系,这就在一定程度上增加了系统的收益。但是如果能给我安利一些更潜在的内容,比如我压根就没有考虑过的兴趣,比如爱尔兰铜笛,这就迈进了极大的一步——试探,或许我由于一两次观看而选择了购买这个乐器,那就是相当成功的兴趣挖掘了。
c.带来更多收益。
推荐系统的终极目的,就是带来收益。如果空谈推荐而没有收益,那是没有意义的。试想如果一个技术不能带来任何价值,那它在企业中应用的意义也是没有的,毕竟企业要盈利。所以推荐系统就是不断的,反复的去解决上面两个问题,提升用户体验,增加用户粘性。
传统泛新闻推荐阅读之殇
1.互联网价值
在我们泱泱大国,政治是一个很严肃的问题,政治正确是很重要的。如果你政治不正确,那不好意思,不管你做什么,都是错的。所以必须要跟着主旋律做事。什么样的内容符合互联网价值,什么东西不符合,很多的监管机构,付出了大量的人力物力来对我们的网络环境进行审查,坚决杜绝违背我们新时代精神的东西。所以,泛阅读就变得很难做。看看今日头条,要在泛阅读做个性化推荐,它包容各种信息,从中央到地方,从高雅到低俗,因为人是遍布各个角落的,人的需求也是各种各样的,从经济利益出发,用户越多越好,那么就需要用更贴合用户兴趣的内容去做分发。有争议性的东西,违背社会主义主旋律的东西,打打杀杀的社会新闻,这里xx自焚了,那里xx被打死了,这些都是互联网价值糟粕,会影响人民的思想,必须要正能量。后来娱乐新闻也不好发,毕竟都是明星那点破事,戏子无情,每天都是这个跟那个搞上了,这个出轨了,那个出柜了,这些东西都是万恶的资本主义国家带给我们的垃圾,也需要给禁了。所以就是在新闻领域那些所谓优质的内容,能激发大量转发和评论的内容,基本上都快没了吧。就剩下点民族仇恨和国家仇恨在这里能引起点大的波澜。守住互联网价值出口,是对人民负责,对年轻一代负责,坚决不能让这些文化垃圾影响了下一代的发展。所以说,这推荐不好做。其实这里还有很多内容,但是不好说太细了,就这样吧。如果你能理解就理解,不能理解就算了。看下一条。
2.娱乐至死危机
近些年来,随着技术的发展和智能手机的普及,越来越多的娱乐性产品开始占领人们的手机。
想想十年前,电子娱乐,看个电影要俩小时,玩魔兽世界要若干若干小时,这种娱乐快感来的还比较慢,比较缓。后来,有了短视频,玩dota,半小时到一小时爽一把。现在呢,小视频15秒,吃鸡,荣耀,也不过十几分钟。跟以前相比,那可以说是高潮迭起了,所以很容易沉迷,或者说更容易沉迷。这种东西对人的成长是没有任何好处的,除了消耗掉你的生命。
在泛阅读领域来看,那就是大量的段子,小视频,动图,几乎都是恶搞,搞笑,低俗的内容,这些对于提升用户量,延长用户停留时长很有用,所以也为流量变现做出了巨大的贡献。
可是这些东西很明显也不符合净化网络环境的要求,属于低劣的内容,不符合互联网内容价值出口的标准,也是要被净化掉的内容。但是没有这些内容,那流量还有那么多吗,用户使用时长还有那么长吗,变现能力肯定是要下降了。
3.主观体验过强
泛阅读的推荐实在不好做,从无到有容易,从0%到50%好做,但是50%再提升却很难。因为泛阅读的主观体验实在是难以捉摸。人们在泛阅读的时候是有非常大的不确定性的,或者说我们对于用户的行为和兴趣收集是极为有限的。不管是依赖兴趣,还是依赖用户协同,都很难做到时时刻刻的精准,实际上,用户在泛阅读的推荐观感总是时好时坏,但是也有时好的就觉得很玄幻。
在商品推荐中,用户行为一般认为是比较好收集的,用户的消费习惯在一段时间内比较固定,而且根据商品的属性,用户的购买行为也可以比较确定的划分。
但是对于泛阅读来说,用户可能在早上的某一时刻只是想看看社会信息,而在下一时刻想了解时事,而下午他想学习一些领域新闻,晚上又想看看段子和美女消遣一下。就算这个用户的行为已经算是比较确定了,但是什么时段去推荐什么内容是需要考虑的。但是实际上一个用户在这种时段的行为也是不确定的,他可能今天想看社会信息,明天又要看娱乐信息。
还有就是对于泛阅读文章的评价也因人而异。如何评价质量好坏,这很难说。一个租房信息,推给没需求的人就是垃圾广告,但是推给一个正在求租的人那可能就是一个精准的投放。
所以,没有详细的用户资料和行为信息,就很难做出详细的策略和算法,只能靠挖掘更多的兴趣维度和用户协同去做各种尝试,当你已经达到某个还不算太高的水平时,就已经很难去提升了。
4.用户消费升级
其实这里还是接着上面那个问题,如今自媒体盛行,谁都可以写上两句。自媒体生产的文章良莠不齐,但是对于文章内容质量的评价却很难执行。因为在泛阅读领域,人群繁杂没有固定的全局属性,每个内容对于不同的用户群可能价值不同。所以呢,泛阅读要流量变现,维持一个足够大的用户基数是很有必要的,但是这也就产生一个问题,在大用户基数下的内容推荐必然会形成一种大多数效应,整体的推荐结果会倾向于大多数人爱看的结果。快手不是没有好的内容,今日头条也不是没有那些小众的东西,但是你很难看到了。除非每个用户都明白推荐的机制而自发自觉的去规范自己的使用行为去调教推荐系统来为自己服务,推荐那些小众的优质的东西。
但是谁都知道那是不可能的,至少在目前来看。
所以,很多用户开始不满,于是开始产生分层现象。他们谋求垂直类优质站点去获取那些优质内容,甚至是付费也在所不惜,而在泛阅读中只用来消遣。而另外一批用户,可能就迷失在了这些一波接一波的快感之中。
具备垂直内容的平台机遇
1.没有政治问题
给你一个迷之微笑,这一行大概不需要过多解释了。
2.更容易掌握的用户行为
能够来垂直内容平台的用户一般都是带有某种诉求的。要么是基于兴趣,要么是基于想要建立兴趣,总之,用户的关注点会有一定的收缩,这符合推荐效果收敛的情况,即便是发生收敛也可以被容忍。
垂直内容一般是针对某一个领域,某一个行业,某一种兴趣,用户行为也相对简单和可预测。即便我们没有掌握太多用户的信息,依然可以在少量用户行为的情况下去推断用户的兴趣。
比如说在线教育平台,如果冷启动用户没有看到自己想要的内容,那很可能去搜索关键词寻找自己想要看的东西。而当他看过一个内容之后,那对于类似内容或者上下游内容的迁移也是概率很大的。这在策略和算法上都比较容易控制了。
假如我想学习机器学习,那我可能还会对数据挖掘,python等内容感兴趣。当然对于不同的垂直领域,可以去做相应的处理,那就是具体的业务拆解了。
3.优质的内容源
比较成熟的垂直内容源一般都形成了自己的PGC或者UGC模式。由于早期用户习惯的培养和整体氛围的形成,对内容有比较严格的把控,不管是PGC内容,还是UGC的内容都有质量上的保障,而且有一些固定的死忠粉。内容创业的时代,有不断生产的优质内容,就可以傲视群雄了。那么接下来要做的就是,提升app端编写的体验,思考如何激励创作,从pc转向移动端。从这些内容中挖掘,标注各种兴趣标签,使用各种分发手段去做feed流,为下一步的变现打好基础。
4.可以调整的变现模式
在移动时代,用户体验要一切从简出发,逐步培养用户习惯。有了优质内容,用推荐的手段去吸引用户,提升用户体验,增加用户粘性。有了用户,那可以继续搞点事情,而不是focus在流量变现上了。
首先可以想到的是内容付费,真正的优质内容在海量数据下成为一种难以获取的稀缺资源。研究者认为根据施拉姆信息选择公式,人们对媒体的注意或选择的可能性(然率)与它能够提供的报偿(价值)程度成正比,与人们获得它的代价(费力)程度成反比。也就是说:人们愿意用最小的代价获取价值最大的新闻信息。这个方向已经有很多公司在做了。
之后是升级服务,例如以财经股票新闻为优质内容的雪球网,可以做一做股票预测的业务,以旅游攻略著称的马蜂窝可以做一做定制化旅行的业务,这些以优质内容为基石,升级服务,从而获取更多的收益。这个就不多说了,根据自己掌握的数据,还可以有更多的渠道去获利。
所以呢
所以呢,泛阅读的个性化推荐不是不能做,而是在这里,已经没有做下去的意义了。你要受制于很多因素,而这些因素都不是技术问题。你没有好办法去屏蔽这些问题,那你只能退而求其次去忍耐这些问题。在泛阅读里求生存,要么打造成很多垂直的内容,要么就不咸不淡的这样继续下去。
从泛阅读解放出来的用户将会寻求下一个价值出口,在哪呢?