一、前言
截止前天,来简书正好一个月。20170730 注册了账号,当晚发布处女作《爬取张佳玮138w+知乎关注者:数据可视化》,从而开启了《python爬虫和数据可视化》系列的写作。
20170827 晚上写完《简书推荐作者风云榜(爬取简书app数据)》,真的一万个没想到,会小火了下,成为自己目前战绩最佳的一篇文章,斩获数据如下:阅读 4274 评论 129 喜欢 213 赞赏 4。现在也仍偶尔在首页出现。原本是想针对上一篇文章的点赞情况和关注情况进行研究,但想到正好来了一个月,那就用自己熟悉的方式进行下全盘的分析和可视化,用不一样的视角,看看作为一名简书用户、一只小透明,我这一个月了都贡献和斩获了哪些数据。
二、爬取简书app数据
爬虫思路与上文《简书推荐作者风云榜(爬取简书app数据)》类似,不再赘述。部分数据格式如下:
三、数据可视化
1.发布文章
首先是一个月来我发布的12篇文章情况。两个文集:《python爬虫和数据可视化》和《随笔》分别收录了7篇和5篇文章。
阅读数和获赞数分布情况如下:有两篇阅读量破3K,正好分别是我的最新的和最早的两篇文章,获赞数也是最高。不过,今天突然发现《Gephi绘制微博转发图谱:以“@老婆孩子在天堂”为例》一文,阅读量很莫名其妙的从1.5K变成了近3.9K,不知道发生了什么???
除了上述的三篇,其他文章的数据虽然非常惨淡,其实内容都还不错,大家可以观光下。
2.粉丝数
这大概是每个人对自己的账号最关心的数据了吧。下图可以直观的看到在20170828当天粉丝数猛然增长,单日涨粉170人次。
虽然《简书推荐作者风云榜(爬取简书app数据)》一文,我自认为写得并不怎么好,数据量仅230条,并不大,但一切就是那么出人意料,也许是无意中蹭上了“简书”这一平台的热点吧。总之,在经历漫长的、平缓的涨粉阶段后,迎来了意外的惊喜,而这对于看到本文、目前战绩平平的写作者来说,或许可以心存期待,不必那么悲观,也许不远的前方正有个surprise在等着你呢。
说起来,最初看到上图时,咋觉得那么像不了解的股票走势图呢。那么,我大概可以自比为一只极具潜力的上升股吧!(脸是什么,能吃吗?)大家快来关注我吧,以后我的走势一定更蔚为可观、牛逼哄哄的,等我成为万粉大V,你们就都是开国元老呀!
3.获赞数
再是第二重要的获赞数。依旧是在20170828当天骤升。回想起当天文章被加入好多专题,也第三次上了首页后,自己抖机灵的各种回复大家的评论,不无心机地使得文章占据版面和专题靠前的位置,还算有点效果。当然在信息爆炸之余,倍感作为一名临时“运营”的辛苦,大概成为大V后,会招募个漂亮的小姐姐帮我运营,正所谓:“好风凭借力,送我上青天”。2333,有人留言预定不?
4.关注和点赞(more)
接着我们进一步将横轴的日期换成最初爬取下的原始数据,即时间戳,可见切换成每一秒钟后,图形走势大同小异。
时间戳是指格林威治时间1970年01月01日00时00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的总秒数。
设置圆圈大小为关注(或点赞)用户的粉丝数,效果如图,之所以要看看对应关注者的粉丝数,是因为曾看到一些用户瞬间关注了一堆账号,故推测可能自己也无形中成为了简书某推荐作者。
如果是因为用户触发了关注按键,自己才被关注,其实利的方面就是看起来涨粉了,弊的方面就是粉丝数虚高,无法转化成有效的后续点赞和互动情况。而我更倾向于凭自己的本事和文章,开创一片天地,吸引真切的对我的文章感兴趣的用户关注我,并和我交流,甚至成为朋友。
单看关注情况还是不够,结合点赞用户的粉丝数可知,关注者用户质量或许不如点赞用户优质。不过可喜的是似乎这一个月来一直有一些大V小V为我点赞,看起来似乎没那么寂寥,到底都是谁那么好心,“事了拂衣去,深藏功与名”呢,一定要找出来!
再是,在整个月所有点赞的343用户和关注的295用户里,同时给我点过赞并关注了我的共有107人,向你们表个白,你们是“巨眼英雄”,必须要努力贡献出更好的内容来回报大家啊!
5. 20170827-20170829复盘
讲了那么久20170828的飙升战绩,那么具体到那一天24小时里的情况又是如何呢?或许大家也和我一样好奇。
那么,就由“西门大侦探”,带你们重回那日的现场,复盘所有的经过吧!
正如上文的“股票趋势图”所示,所有数据在20170827发布新的文章之前都是平平无奇,偶尔会有几个点赞和关注点缀在浩瀚的时间线上,而在22点57分,发布新文章后不久,点赞数就出现了一小波的上涨,追溯回去,当时距离当天结束时间已所剩不多,但就是在这一小时内文章先后被加入专题《今日看点》、被编辑推荐至首页、被加入专题《我和简书那些事儿》、被加入专题《@IT·互联网》。所有这些为后续文章“小火”了下,埋下伏笔,此处手动感谢@South_Lin,这三篇上首页的文章起码两篇都是小姐姐加入《今日看点》,并推荐到首页的吧。
次日,0828,也就是最辉煌的一天,关注人数深夜不绝,夜猫子倒是不少呢,两者数据均在6点后逐步发展壮大,于9点前后达到单位小时的顶峰,而当天乃是周一,新的一周的上班第一天。
再之后虽然数据开始走低,但两者交相辉映,共同形成的信息轰炸依旧存在,直到29日才算渐渐落下帷幕。
6.头像拼图
上一篇文章小火了后,不少人表示会努力写作,成为简书推荐作者和签约作者,然后出现在我的程序里。其实本文就已经包含了他们,当然本次没有爬取评论情况,点赞和关注的用户的头像虽然爬取下来了,但拼图大家真的想看吗。不给你们看哦。
四、小结
这大概是另类的一篇初到简书一个月的记录,用的也是我还算熟悉的数据可视化,也许以后粉丝、点赞等数据质量不错的话,还会继续用这样的方式来记录。完。