本文标题原为:“Python-新时代的智慧工具(三)”
PC互联网时代,外事不决问Google,内事不决问百度,后祸起于萧墙,凡事都问度娘...
当时,用好度娘的标志在于用好关键字的各种巧妙组合,从而能够高效的从各种各类网站上抓取你需要的信息。
但,自2014年Mobile流量第一次大于PC流量以来,发生了很多变化,信息无处不在,多到超过了人们的承受极限。
度娘老去,新鲜不在,信息入口转移到了多个平台上。
在这样的环境下,数据收集已经不是第一要务,数据的“垂直维度的高效率收集”,才是第一要务。
但是,要达成这一点,需要对于“计算机”领域的长期知识积累。需要善用各种先进的大数据处理工具。
比如,Python+词云,不多说,以社交媒体上做的最好的BMW为例,上图:
第一步:从BMW官方微博上快速取得自该账号开立以来的所有的图文信息。
BMW官方微博的ID为:1698264705,用如下Python编程实现“垂直维度的高效率数据”的抓取。
啧啧,不到10分钟,别摸我官方账号自开立以来所有的文本和图片信息都出来了。
二、分析BMW官微都在说些啥
先看看图片,嚯,442张各种图片呢,勤劳的Social Media代理公司...
再看看文本...未清洗的数据跟未化妆的女人一样,没法儿看呐...
清洗过后:
上妆后:果然是驾驶者之车啊,关键词:”动感、体验、驾驶、赛道,乐趣“,够风骚。
以上,好几百页微博页面,不用一页一页的去翻,记录,只需要一段代码,10-20分钟即可处理完毕,
这,就是当下时代营销人员的效率!