用R做latent growth modeling（潜变量增长模型）

今天上午不是很忙，贴一个之前用R做的latent growth modeling（潜变量增长模型）。项目背景是给100多个学生做了12次的干预，想看一下有没有什么因素对干预效果有影响。

没有时间加太多注释，大家将就着看一下吧。根本方法还是用lavaan定义model，这次是把截距 i 和斜率 s 设定为潜变量，用不同时间点的测量结果做估计。

教学视频的话可以看这里

之前写过一个用R做结构方程模型的帖子，是我所有文章里阅读量最高的（已经快3000了！），如果这个文章阅读量很高的话，应该说明大家很需要这方面的教学，我会考虑再写一篇稍微详细一点文章介绍一下步骤。不过对于没有R基础的同学，我还是建议稍微学一下R，这样看到下边的代码应该就已经知道怎么做自己的分析了。

Linear regression and latent growth modeling

Hanchao

June 18, 2018

# 这里有个很重要的一次向加载很多个package的包，可以作为一个常用模板
pacman::p_load(readxl,haven,
dplyr,tidyr, purrr, broom,
ggplot2, corrplot, semPlot,
psych,lavaan, mice)

ggplot(minilit,aes(x=Attend_Percentage,y=WARL_Change,color=Gender))+
  geom_point(alpha=0.8,position="jitter")+
  geom_smooth(method="lm")

image.png

ml_orig <- read_excel("C:/Users/houh1/OneDrive - The University of Melbourne/MiniLit/MiniLit_Path_Data_Clean_20180109 for R analysis.xlsx",sheet = 3)

ml_long <- ml_orig %>%
  gather(time,WARL_score,c(11:23))

ml_long$time <- factor(ml_long$time, levels=c("T0","T1",    "T2",   "T3",   "T4",   
                                              "T5", "T6",   "T7",   "T8",   
                                              "T9", "T10",  "T11",  "T12")
                       )
ml_long <- mutate(ml_long,time_num=as.numeric(time)) #long data to plot

ml_long %>%
  ggplot(aes(x=time,y=WARL_score))+
    geom_boxplot()

## Warning: Removed 547 rows containing non-finite values (stat_boxplot).

image.png

ml_long %>%
  filter(!is.na(WARL_score) & WARL == "Y")%>%
  ggplot(aes(x=time_num,y=WARL_score))+
    geom_point(alpha=0.5)+
    geom_smooth(method="lm",se=FALSE)+
    facet_wrap(~RCT_ID)

image.png

ml_long %>%
  filter(!is.na(WARL_score) & WARL == "Y")%>%
  ggplot(aes(x=time_num,y=WARL_score,color= factor(RCT_ID)))+
 # geom_point(alpha=0.5)+
  geom_smooth(method="lm",se=FALSE,size=0.2,show.legend = FALSE)

image.png

ml_model_use <- ml_orig %>%
  filter(WARL=="Y")%>%
  select(10:23,54)

cor(ml_model_use$Attend_Percentage,ml_model_use$TS_Student_Engage, use="complete.obs")

## [1] 0.2046037

summary(ml_model_use)

##  Attend_Percentage       T0              T1              T2       
##  Min.   :0.08333   Min.   : 0.00   Min.   : 1.00   Min.   : 3.00  
##  1st Qu.:0.73148   1st Qu.: 8.00   1st Qu.:13.25   1st Qu.:17.00  
##  Median :0.79630   Median :12.00   Median :18.50   Median :21.00  
##  Mean   :0.78895   Mean   :11.38   Mean   :20.85   Mean   :23.97  
##  3rd Qu.:0.86730   3rd Qu.:15.00   3rd Qu.:26.75   3rd Qu.:30.00  
##  Max.   :0.98058   Max.   :17.00   Max.   :52.00   Max.   :54.00  
##                                    NA's   :1       NA's   :5      
##        T3              T4              T5              T6       
##  Min.   : 5.00   Min.   : 5.00   Min.   :10.00   Min.   : 6.00  
##  1st Qu.:17.00   1st Qu.:21.00   1st Qu.:23.50   1st Qu.:22.00  
##  Median :25.00   Median :27.00   Median :33.00   Median :31.00  
##  Mean   :24.79   Mean   :29.02   Mean   :34.96   Mean   :32.16  
##  3rd Qu.:30.00   3rd Qu.:34.00   3rd Qu.:43.50   3rd Qu.:42.00  
##  Max.   :51.00   Max.   :62.00   Max.   :75.00   Max.   :76.00  
##  NA's   :32      NA's   :2       NA's   :68      NA's   :18     
##        T7              T8              T9             T10       
##  Min.   : 6.00   Min.   : 9.00   Min.   :12.00   Min.   : 9.00  
##  1st Qu.:27.00   1st Qu.:30.00   1st Qu.:31.00   1st Qu.:29.50  
##  Median :33.00   Median :37.00   Median :37.00   Median :42.00  
##  Mean   :35.82   Mean   :38.71   Mean   :36.39   Mean   :43.14  
##  3rd Qu.:42.00   3rd Qu.:46.50   3rd Qu.:42.75   3rd Qu.:54.75  
##  Max.   :99.00   Max.   :92.00   Max.   :69.00   Max.   :90.00  
##                  NA's   :1       NA's   :29      NA's   :21     
##       T11             T12        TS_Student_Engage
##  Min.   :15.00   Min.   : 8.00   Min.   :3.000    
##  1st Qu.:29.25   1st Qu.:31.00   1st Qu.:3.167    
##  Median :43.00   Median :41.00   Median :3.500    
##  Mean   :43.74   Mean   :43.83   Mean   :3.524    
##  3rd Qu.:53.00   3rd Qu.:55.00   3rd Qu.:4.000    
##  Max.   :88.00   Max.   :93.00   Max.   :4.000    
##  NA's   :37      NA's   :19      NA's   :30

# Missing value imputation
imp <- mice(ml_model_use)
ml_cpl <- complete(imp)
ml_cpl <- ml_cpl %>%
  filter(Attend_Percentage >0.5)

model1 <- ' i =~ 1*T0+1*T1+1*T2+1*T3+1*T4+1*T5+1*T6+1*T7+1*T8+1*T9+1*T10+1*T11+1*T12
           s =~ 0*T0+   1*T1+   2*T2+   3*T3+   4*T4+   5*T5+   6*T6+   7*T7+   8*T8+   9*T9+   10*T10+ 11*T11+ 12*T12
'

model_var <- ' i =~ 1*T0+1*T1+1*T2+1*T3+1*T4+1*T5+1*T6+1*T7+1*T8+1*T9+1*T10+1*T11+1*T12
           s =~ 0*T0+   1*T1+   2*T2+   3*T3+   4*T4+   5*T5+   6*T6+   7*T7+   8*T8+   9*T9+   10*T10+ 11*T11+ 12*T12
            i ~ Attend_Percentage + TS_Student_Engage
            s ~ Attend_Percentage + TS_Student_Engage
          '
fit1 <- growth(model1, data=ml_cpl)
fit_var <- growth(model_var, data=ml_cpl)

summary(fit1,fit.measures=T)

## lavaan (0.6-1) converged normally after  86 iterations
## 
##   Number of observations                            93
## 
##   Estimator                                         ML
##   Model Fit Test Statistic                     598.147
##   Degrees of freedom                                86
##   P-value (Chi-square)                           0.000
## 
## Model test baseline model:
## 
##   Minimum Function Test Statistic             1932.696
##   Degrees of freedom                                78
##   P-value                                        0.000
## 
## User model versus baseline model:
## 
##   Comparative Fit Index (CFI)                    0.724
##   Tucker-Lewis Index (TLI)                       0.750
## 
## Loglikelihood and Information Criteria:
## 
##   Loglikelihood user model (H0)              -3985.910
##   Loglikelihood unrestricted model (H1)      -3686.837
## 
##   Number of free parameters                         18
##   Akaike (AIC)                                8007.821
##   Bayesian (BIC)                              8053.407
##   Sample-size adjusted Bayesian (BIC)         7996.585
## 
## Root Mean Square Error of Approximation:
## 
##   RMSEA                                          0.253
##   90 Percent Confidence Interval          0.234  0.272
##   P-value RMSEA <= 0.05                          0.000
## 
## Standardized Root Mean Square Residual:
## 
##   SRMR                                           1.118
## 
## Parameter Estimates:
## 
##   Information                                 Expected
##   Information saturated (h1) model          Structured
##   Standard Errors                             Standard
## 
## Latent Variables:
##                    Estimate  Std.Err  z-value  P(>|z|)
##   i =~                                                
##     T0                1.000                           
##     T1                1.000                           
##     T2                1.000                           
##     T3                1.000                           
##     T4                1.000                           
##     T5                1.000                           
##     T6                1.000                           
##     T7                1.000                           
##     T8                1.000                           
##     T9                1.000                           
##     T10               1.000                           
##     T11               1.000                           
##     T12               1.000                           
##   s =~                                                
##     T0                0.000                           
##     T1                1.000                           
##     T2                2.000                           
##     T3                3.000                           
##     T4                4.000                           
##     T5                5.000                           
##     T6                6.000                           
##     T7                7.000                           
##     T8                8.000                           
##     T9                9.000                           
##     T10              10.000                           
##     T11              11.000                           
##     T12              12.000                           
## 
## Covariances:
##                    Estimate  Std.Err  z-value  P(>|z|)
##   i ~~                                                
##     s                 1.417    0.841    1.684    0.092
## 
## Intercepts:
##                    Estimate  Std.Err  z-value  P(>|z|)
##    .T0                0.000                           
##    .T1                0.000                           
##    .T2                0.000                           
##    .T3                0.000                           
##    .T4                0.000                           
##    .T5                0.000                           
##    .T6                0.000                           
##    .T7                0.000                           
##    .T8                0.000                           
##    .T9                0.000                           
##    .T10               0.000                           
##    .T11               0.000                           
##    .T12               0.000                           
##     i                19.140    0.991   19.309    0.000
##     s                 2.099    0.088   23.964    0.000
## 
## Variances:
##                    Estimate  Std.Err  z-value  P(>|z|)
##    .T0              111.412   17.079    6.523    0.000
##    .T1               18.699    3.450    5.419    0.000
##    .T2               13.536    2.547    5.315    0.000
##    .T3               12.306    2.232    5.512    0.000
##    .T4               14.522    2.463    5.896    0.000
##    .T5               53.567    8.129    6.590    0.000
##    .T6               24.247    3.857    6.287    0.000
##    .T7               23.761    3.841    6.186    0.000
##    .T8               46.793    7.290    6.419    0.000
##    .T9               18.008    3.290    5.474    0.000
##    .T10              33.597    5.700    5.895    0.000
##    .T11              40.386    6.916    5.839    0.000
##    .T12              41.140    7.335    5.609    0.000
##     i                85.001   13.409    6.339    0.000
##     s                 0.552    0.105    5.257    0.000

semPaths(fit_var)

image.png

最后编辑于：2018.06.18 09:43:31

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,496评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,407评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,632评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,180评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,198评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,165评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,052评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,910评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,324评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,542评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,711评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,424评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,017评论 3赞 326
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,668评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,823评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,722评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,611评论 2赞 353

用R做latent growth modeling（潜变量增长模型）

Linear regression and latent growth modeling

Hanchao

June 18, 2018

推荐阅读更多精彩内容