【R语言】周杰伦超话微博等级与词频分析

【主要成果图】

一、分析需求

对某一天发表#周杰伦#的部分超话微博进行爬取,进行词频和转发量的分析

二、关于发送超话的微博等级

从下图中可以看到,发布超话最多的用户是普通用户,点赞量和微博评论量最多的金V用户(金V用户的申请门槛就是每月浏览量超过1000万的微博用户,所以和表现契合),但转发量最多的蓝V用户(官方账号,证明大家追星依旧理性,更愿意转发官方账号信息)。另外悬殊的数量可以看出,微博中最少的蓝V和金V用户,贡献了最大的微博用户互动。

三、分析微博评论量的影响因素

用决策树模型,分析微博评论量和微博等级、点赞数、转发量有何关系

运行R代码:

setwd("C:/Users/emera/Desktop/ jay_csv")

jay_mircoblog_data <- read.csv('jay.csv')

x <- data.frame(jay_mircoblog_data)


head(x,5)

summary(x)

str(x)


#决策树

library(rpart)

library(rpart.plot)

data.tree <- rpart(微博评论量~微博等级+微博点赞数+微博转发量,data=x)

rpart.plot(data.tree)

得到下图,图中我们可以看到,微博评论量主要和微博点赞数和微博转发量相关。

微博评论数、转发数、点赞数三者看似有较大的相关性,我们识别一下这三个变量之间是否具有多重相关性,R代码如下,执行结果如图,各变量之间GVIF小与十,我们排除他们之间的多重共线性,判断这两个变量是分别对评论数作出影响的:

#线性回归模型

data_linear_regression <- lm(微博评论量~微博等级+微博点赞数+微博转发量,data=x)

summary(data_linear_regression)

#install.packages("car")

library(car)

#查看自变量膨胀因子看是否具有多重相关性

vif(data_linear_regression)

我们进一步拟合微博等级对评论的影响,看是否具有较高的相关性,得到结果如图。

#微博等级的评论量的影响

vip_level_linear_regression

<- lm(微博评论量~微博等级,data=x)

summary(vip_level_linear_regression)

图中我们可以看到,以微博黄V为参考点0,微博金V和微博蓝V对评论数的影响系数分别是97.4和26.4,有趣的是微博达人和普通用户比,微博达人的评论系数更低。我们可认为普通用户可能比微博达人更重视和朋友之间的互动,而微博达人由于每天转发/自创微博量大,和好友的互动反而不及普通用户频繁。

四、对微博内容进行分析,找出超话中最受大家关注的词语

运用R语言自然语言处理和词云绘制函数包制作

#周杰伦超话词云#

#'jiebaR','jiebaRD'分词

#'wordcloud2'绘制词云


#install.packages('jiebaR')

#install.packages('jiebaRD')

#install.packages('wordcloud2')

#install.packages("tm")

#install.packages("NLP")


library(jiebaRD)

library(jiebaR)

library(wordcloud2)

library(NLP)

library(tm)


jay_data <- read.csv("C:/Users/emera/Desktop /jay_csv/jay.csv")

jay_word <- jay_data$微博内容


#建立分词模型

mixseg <- worker("mix")

#修改factor数据类型为character

class(jay_word)

jay_word_chara <- as.character(jay_word)

class(jay_word_chara)

#开始分词

jay_word_segment <- segment(jay_word_chara,mixseg)

jay_word_segment

stopwords <- read.table("C:/Users/emera/Desktop/ ay_csv/jay_stopwords.txt",sep="\n",encoding="UTF-8")

#查看stopwords类型

#class(stopwords)

#转stopwords数据类型

stopwords <- as.vector(stopwords[,1])

#head(stopwords,5)


#removeWords()在包tm下

#jay_words_result <- removeWords(jay_word_segment,stopwords)


# jay_word_segment1 <- as.character(jay_word_segment)

# stopwords1 <- as.character(stopwords)

class(jay_word_segment)

class(stopwords)

jay_words_result <- tm_map(jay_word_segment,removeWords,stopwords)


# 看看是否成功去除

# jay_word_segment

# jay_words_result


#词频统计

freq <- table(jay_words_result)

#查看词频统计结果

freq

#绘制词云

wordcloud2(freq,shape = 'star')


# freq_nostop <- table(jay_word_segment)

# #查看词频统计结果

# freq_nostop

# #绘制词云

# wordcloud2(freq_nostop)

为了更直观的看出粉丝在讨论什么,停用词中把超话和周杰伦两个频次极高的词都停用了,得到分析结果如下

我们可以看到,周杰伦超话中经常提及的内容包括粉丝、青春、阿姨、偶像等等,符合周杰伦80、90后偶像的事实。同时可以看出超话中出现了很多流行用语,比如被迫营业、冲冲冲等等。同时还有奶茶、减肥等周杰伦热梗。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,084评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,623评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,450评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,322评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,370评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,274评论 1 300
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,126评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,980评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,414评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,599评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,773评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,470评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,080评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,713评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,852评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,865评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,689评论 2 354