大数据的风肆意地刮,席卷了各个行业,一夜忽扫万枝花,却是春风吹又生。这阵风其实早已吹进了娱乐圈,只不过我们的眼球往往被花边新闻所吸引,没有过多关注这些新鲜的玩法,接下来,让我们一起走进科学,探索娱乐行业的大数据。
好大一块蛋糕!
国家富强了,人民富裕了,生活富足了,老百姓们除了吃饱穿暖,也越来越注重精神和情感世界的丰富多样。
自2010年以来,娱乐行业蓬勃发展,电视剧、电影、网络综艺、网剧、网络视频等一系列娱乐衍生品喷薄而出。2011年-2017年间,中国的网络视频市场规模从63亿元人民币增长至850亿元人民币,年复合增长率达到了54.3%。
据国家广电总局和其他公开资料统计,2014年网络综艺节目数量仅47部,而到了2017年,网综的数量达到了197部,网络大电影播放数量也由450部增加至2017年的1892部,而网剧的数量由131部增加至206部。
我们再来看看电影市场,2012-2017年期间,中国电影市场飞速发展,2017年总票房收入达559亿元人民币。欣慰的是,我国国产电影的数量以及制作水平都在逐步提高,与引进的国外电影相比,国产电影的票房份额也在不断提升,目前国产电影票房占据53.8%的市场份额。
曾几何时,10亿票房是多少制片方所渴望越过的殿堂门槛,而随着《美人鱼》33亿,《战狼2》56亿等一个个天文数字的爆出,10亿票房不过是卖座电影的及格线而已。
所以,无论是从受众面、关注度、行业发展趋势还是盈利空间来看,娱乐产业都是一块奶油鲜糯欲滴,飘香四溢的金黄大蛋糕。
最关键的是,随着互联网的发展,娱乐产业沉淀了大量的数据,有着巨大的挖掘空间,这就好比是把一块蛋糕摆到了面前,还准备好了刀叉,谁能不蠢蠢欲动。
怎么吃?
这么香的一块大蛋糕应该怎么吃呢?
我们先来看看都有谁吃过:
其实早在七八年以前,美国人就试吃过,其中最成功的当属Netflix出品的《纸牌屋》。作为一名《纸牌屋》的脑残粉,感慨于Underwood “人至贱则无敌”的同时,也不得不惊叹于Netflix的神机妙算。
作为世界上最大的在线影片服务商,Netflix拥有3000多万的订阅用户,这些用户每天在Netflix上会留下3000多万条行为数据,其中包括300多万次搜索和400多万次评分。
基于这些数据,Netflix可以了解用户的偏好,他们热议的话题,他们喜爱的演员等等,通过一系列分析,他们可以识别出《纸牌屋》这个IP好不好,用户是否会喜欢,该找谁来当导演,谁来主演,如何运作,如何宣传。
经过分析决策,Netflix用1亿美元买下了《纸牌屋》版权,请来David Fincher(导演)和Kevin Spacey(主演),助力《纸牌屋》火爆全球,甚至连奥巴马都追到入迷。
接下来,再来看看我们应该如何吃:
1)剧本孵化
剧本孵化一般有两种途径:一种是直接买一个IP,这种方法相对比较保险,因为已有粉丝基础,但在改编之前仍需要先对IP进行评估,以此了解该IP是否有足够且持续的关注度,受众人群基数如何。
另一种途径是原创剧本,那么在创作之前可以先基于大数据针对用户的喜好进行挖掘,识别出用户所关注的类型、标签,然后再按照细分市场划分的方法,来确定要进入的领域,创作符合该类用户喜好的剧本。
2)选角评估
我们可以针对各个演员的热议程度、号召能力进行初筛,之后再对演员的粉丝群进行画像分析,看看各演员的粉丝是否符合这部戏的受众定位,是否可以运用这些演员进行引流。
此外,还需要考量大众对这些演员的认知印象,是否符合剧本中人物的形象,最后再看看价格是否能谈妥。
3)广告植入
有了剧本,有了演员,当然还需要钱,除了投资方以外,通过广告植入也有不少的经济来源。不过广告也不能随便植入,收钱之前,还需分析该品牌的品牌形象是否契合剧本中的具体场景。收完钱之后,还得再复个盘,评估一下广告的到达率、与品牌的关联度、观众喜爱度及对品牌而言的认知提升。
4)营销宣发
以电影为例,在宣发时需要确定排片。
一是上线的时间,同时期是否有其他同类型的电影?是否有其他关注度很高的对手?
二是发行的区域,我的电影有哪些目标人群,他们分布在哪些地方?在做宣传时,如何能触达到这些用户?这些都是可以通过大数据来解决的问题。
美国的大数据在娱乐行业的应用自然是走在了前面,在很多方面都吃的比较透了,不过近几年,国内的大数据发展也紧随其后,在娱乐领域做了很多尝试,吃的越来越开。
上述的吃法可能还比较抽象,接下来,我们来回放一下国内大数据的吃蛋糕过程。
《小时代》是一部饱受争议的国产连续电影,电影好不好先不做评价,这一系列电影确实为大数据研究提供了很完整的素材。
首先,《小时代》电影是由IP衍生而来,有着一众原著粉丝,那是她们课桌下、被窝里按耐不住的青春回忆。
其次,《小时代》角色众多,在演员的评估上大有文章可作。
再者,《小时代》电影接连拍了好几部,每一部的间隙都有机会去做分析和调整。
最后,《小时代》系列电影饱受争议,媒体和观众的关注度较高,因此有大量的内容可待挖掘。
1)IP评估
对IP的评估大致有三个维度:
一是IP的粉丝数,这决定市场的规模,原著粉丝数越多,风险相对越小。
二是IP话题热度,通过书籍的阅读量、书籍排名、相关文章阅读量和相关内容搜索量可以识别IP的话题性和可传播性。
三是IP的活跃度,这个IP是否在持续发酵,是否不断有新用户关注,要做到这一点难度较大,除了《西游记》这种IP能延续百年,直至今日,还被翻来覆去炒到发焦以外,其他IP的活跃度一般都呈现出明显的生命周期。
这里的《小时代》书籍虽然热度已过,但别忘了,郭敬明这个IP可是非常活跃的。
2)如何选角
对于有着较高关注度的明星演员而言,各平台的数据并不缺乏,基于媒体资讯和搜索评论数据,可以提取出大众对于演员形象的认知关键词。当然,选角更多还是由主创人员主观抉择,但对于演员的形象词分析可以提供辅助,特别是在拍续集时,对于角色形象突出的演员,可以适度加大戏份。
比如:郭采洁通过《小时代》颠覆了大众的认知,完美、华丽、霸气等关键词频频冒出,她所扮演的“顾里”也逐渐承担起了更重的戏份。
3)主演口碑评估
《小时代》主演众多,通过观众对于前几部电影中演员的评价,可以准确了解到观众的情感倾向。基于文本情感分析,可以看到,观众对于“简溪”的演员李悦铭的负面评价明显高于其他,那么在后续的电影中,可以直接考虑换演员或者删减这一角色的戏份。
4)设定哪些剧情
通过对之前剧情的分析,可以发掘出观众对于各类剧情的喜好程度,比如:基于数据可以发现,观众对圣诞夜、顾里生日宴会的互撕、顾源裸上身等情节关注度极高,那么后续可以继续加入更多“闺蜜疯闹”、“情感冲突”、“腐女”的情节元素。
5)受众是谁
数据的结果其实和大众的认知是一致的,《小时代》的关注者以女性为主,她们大多是90后的原著粉,比较宅,喜欢音乐、影视、八卦等等,因此在进行营销的时候可以针对这些用户所活跃的视频网站、社交平台、新闻媒体进行宣传。
6)在哪里排片
排片量直接会影响到票房的成绩,《战狼2》就是个最好的例子,通过小镇青年带动了票房的增长。对于《小时代》而言,热议话题的发起者与参与者多为北上广和深圳、成都等一二线城市居民,因此,一二线城市是《小时代》的主要战场,那么在做宣传活动和排片的时候也要以一二线城市为主。
用什么吃?
方法都知道了,那这些数据是从哪儿来的呢,要用到哪些工具呢?
通过大数据进行娱乐行业的分析,最核心的方法自然是文本挖掘技术了。
大体来讲,文本挖掘所基于的数据源主要有四类:
1)行业中的票房和收视数据
这些数据很多票房榜单和中介销售平台都有,基于这些数据可以评估各个电影的卖座程度,当然,热卖指数的计算还需要考虑到时间和同期的其他电影票房。
通过对电影的关键词提取,可以形成一套标签库,将电影打上各类标签,那么基于决策树的思想,通过观众对电影的选择行为,可以分析出观众对于各类标签的偏好程度,从而指导主创人员根据观众的喜好进行创作或IP选择/改编。
2)搜索数据
热搜可以很好地体现人们的关注度,对于热搜标签的提取和评估和上述的方法相同。除此以外,搜索数据还可以很好地支持IP的评估,通过建立多项指标进行聚类,可以对现有IP进行分类,提供IP选择的参考。
3)媒体数据
媒体反映的是大众的关注焦点,同时也对大众的认知起着引导作用,将媒体数据进行摘要提取,可以了解到媒体的关注点,此外,在进行宣发营销时,同样可以借用媒体的力量酝酿发酵,那么在媒体的选择上需要先进行考量什么媒体的调性更适合,哪些媒体的受众人群和本剧相吻合。
在运用网络媒体进行传播时,还可以通过链接参数进行全流程跟踪,以此分析该媒体资讯是否有较强的裂变能力,从而考虑是否“加注”。
4)评论数据
随着社会的发展,网民们越来越乐于吐露自己的心声,“键盘侠”们从天而降,裹着正义的披风大杀四方,没有人知道他们叫什么,他们身后留下的只有泛着唾沫星子的战场。
这么多的评论数据,当然需要进行提取分类,通过观点情感挖掘,了解他们的主要论点和倾向,一方面可以用于选角的评估或剧情的修改,另一方面,还可以在电影发布初期进行舆情监控,当发现不好势头的时候,及时进行公关引导,或在水军的大坝决堤之前,筑起高墙。
结语
这是一个“娱乐至死”的时代么?
大数据的方法好像只有迎合,但尼尔·波兹曼说:
“有人说我取悦于人,我说这很好,如果一个教授上课时表现幽默,人们就会带着记忆下课”。
我们需要严肃文学的清高和深刻,但也需要娱乐文化的寓教于乐。创作者可以决定想表达什么,但你能说给多少人听,说给哪些人听,如何说给他们听,这也许是大数据能赋予的价值。
作者:Mr.墨叽,公众号:墨叽说数据产品