#Netflix的历史#
est1997年
# Netflix如何通过拆解电影去把握内容和拆解之后再形成的电影“微类型”#
-团队对电影进行标注和评级
-采访了标签员(叫tiger):把正确的内容推荐给正确的用户,电影里面角色的标签
-推荐给相关的主题的电影
-topgun 壮志凌云:涵盖空战、友情、亲情等元素,以及各个标签评分,即力度:对相同标签的所有的电影通过横向比较得出这个标签在这个电影里的力度
#推荐算法的数据维度和推荐时考虑到因素#
算法数据来源:
用户评分数据
电影热度
播放信息:时长、时间、设备类型
用户播放列表
元数据:演员、导演、类型、评分、评论
推荐监控:推荐位置对用户行为的影响,滚动、鼠标悬停、点击、页面停留时长
社交数据:好友的播放和评分行为
用户搜索数据
外部数据:票房数据、影评
人口统计学、地点、语言、或其他临时性数据
推荐策略考虑的维度:
背景、电影热度、兴趣、证据(猜测是用户行为数据、好友数据等依据)、新奇、多样性、新鲜度(context, title popularity, interest, evidence, novelty, diversity, freshness),etc…
#用课程中的策略四要素梳理推荐策略#
#待解决问题#
给每个用户推荐他喜欢的电影和剧
#输入#
1.用户喜好
· 显式数据:点赞、打分、调研问卷…
· 隐式数据:一周看完一部剧、一个月看了三次同一部电影
2.影片内容
· 表面层:片名、类型、主创
· 元素层:电影元素
3.相似用户喜好:基于用户在平台内行为
4.用户好友喜好:连接facebook账户
#计算方式#
大数据+算法
机器学习(AI)
生成电影分类类型
#输出#
个性化电影分类:每行是Netflix猜测的用户可能喜欢的电影。每行包含三个层次的个性化:altgenre的选择、altgenre中电影的选择、电影的排序,例如:
Emotional Fight-the-System Documentaries:情感充沛的反体制纪录片
Period Pieces About Royalty Based on Real Life:基于事实的皇室掠影
Foreign Satanic Stories from the 1980s:80年代的外国邪恶电影
用户的播放列表:用户可能想反复看已经看过的电影,需要有一个合适的位置把这一行放进去。
#一张图看懂Netflix的工作方式#
从假设出发--选择模型-训练模型-训练满意-ab测试-训练不满意-修改假设
#一些扩展内容#
-编剧会根据用户的喜好,剧情会根据用户的喜好哪儿不喜欢等来修改剧情
#个性化海报推荐#
-不同人的海报推荐
-不标题党
#Netflix的自省#
算法中关注diversity:不光推荐喜欢的,另外还会帮助发现跨可能喜欢的
#其他领域类似公司#
其他公司,推荐音乐
推荐系统:用户、内容、算法决定了推荐度有多高
算法没有价值观,算法能够传递人的价值观