内容消费
概念
内容生产:特定目的下,生产者对世界一次理解的沉淀
如:手机照片体现主观意志
内容消费:特定场景下,消费者对于沉淀的二次理解
消费者对内容理解深度不会超出自己对世界的认识。功利性创作需要结合受众特点。
如:情人节看的不是电影。看视频开弹幕不仅是看视频。
视频火爆原因
图文vs视频
评估标准:创作最后都是为了表意的准确性和传达的有效性。其中表意取决于对象特点(风丰富消费体验),传达有效性依赖于消费场景(车载——音频,被动获取信息。阅读——文字,主动获取内容,表达深奥难懂信息)
火爆原因
1、消费端:补偿
有很多可以被视频化表现的内容,在过去一两年被快速生产出来
2、生产端:焦虑
视频和图文都需要用眼看。但,用户消费时长一定,内容消费篇数却在下降。图文自媒体需要升级
3、平台端:催熟
一方面,视频可以拉长时长,而间接影响留存。另一方面,短视频能够增加流量广告曝光机会(相对于长视频,短时长带来更多播放次数,因为要频繁挑选视频,增加了刷新次数。这就为贴片广告和信息流广告提供了机会)。于是,多平台催熟生产端,培养消费者
生产端动机
不同平台,不同生态
算法分发
标签
定义
标签是对高维事务的降维理解,抽象出实物更具有代表性、更显著的特点
标签产出方式:
内容和用户两种
在内容画像层面,以音乐为例,最典型的有两种方式
专家系统:潘多拉音乐基因工程。歌曲体系抽离出450个标签,细化到如主唱性别、电吉他失真度。。。
UGC产出:在豆瓣,用户为豆瓣贡献了大量有语义表意性标签。由于用户多样性和编辑开放性,必须经过特定清洗和归一才能投入使用
在用户画像层面,分为静态和动态两部分
静态:设备信息、地理位置、注册信息。但都是和业务无关的信息。
具体到业务场景中,可以用用户的显性和隐形行为对用户偏好进行猜测。
动态:
以知乎读书会为例,
显性行为:点击、收听、评分、评论
隐性行为:收听完成度、是否有拖拽快进、页面停留时长
通常由于显性行为不够丰富,我们需要使用隐性行为扩充对用户理解。完播率、是否快进、详情页停留时长,都会被系统统计,用来判断是否真的喜欢个人的讲解、喜欢某本书内容
此外,还可以对文章的关键词进行抽取,将与之相似的内容聚成一个簇类。因为专家系统的分类体系对变化不敏感,响应不及时,而聚类可以挖掘出更多内容隐含信息
两者关系
内容画像和用户画像是相互影响的循环关系
1、内容画像决定人的画像
比如评论、收藏、收听了很多摇滚乐,自然就是喜欢摇滚乐的用户
2、人的画像会影响内容画像
基于用户行为,对内容做出的后验投票。在大体量视频上传体系中,放弃挨个打标签,转而利用用户播放行为来试图猜测内容属于哪类。
如:死神来了。看标题以为是电影,但看视频的用户大量是猎奇类用户,发现原来是个车祸视频集锦
协同推荐
标签是对事物抽象理解,以人的行为来标记内容,就是协同过滤了,即把用户消费行为作为特征,以此进行用户相似性或物品相似性的计算,进行信息匹配
协同推荐有三个子类
1.基于物品
定义:先确定喜欢的物品,再找到与之相似的物品进行推荐。
机制:物品间的相似度不是从内容属性角度衡量,而是从用户反馈角度来衡量。使用大规模人群喜好进行内容推荐
2.基于用户
定义:找到与你口味相似的人群,将这群人共同喜欢的东西推给你
3.基于模型
定义:应用用户喜好信息训练算法模型,实时预测用户可能的点击率