stata结果导入excel-频率分析

前段时间知道stata16可以直接导入SPSS数据,就把stata16安装了

然后,就想了解stata16的新功能,官方介绍:New in Stata 16

最开始,是里面的Reproducible reporting吸引我,毕竟一直在想着怎么写动态分析报告,即分析结果和报告同步更新。

就研究了一下里面提到的dyndocputexcelputword命令

首先,就是研究了putexcel命令,想着把频率分析结果能直接导入excel,尤其是有大量变量的时候

简单尝试了一下,发现还是很好用,尤其是导出来中文不会乱码,而且格式自定义,其他命令如logoutasdoc等都有各种问题的。

接下来,分不同帖子写写不同分析结果如何批量导出结果至excel,

首先是,频率分析结果导入excel

1. 思路

  1. 在stata中将频率分析结果形成矩阵(即结果表);
  2. 再将矩阵导入excel;
  3. 根据每个矩阵行数,自动在上个矩阵结束后空一行,导入新的矩阵;
  4. 将变量存成暂元,只需添加变量名,则自动生成新的表;

2. 所有代码

use data_analysis,clear
putexcel set result.xlsx,sheet("单变量",replace) modify
local rownum=1
local rntable=1
local frevar "P4Q3 P4Q6 P4Q7 P4Q8 P4Q9 P4Q10 P4Q11 P4Q1 P4Q2"
foreach var of varlist `frevar'{
fre `var',nov
putexcel A`rownum'="`r(label)'",hcenter vcenter txtwrap bold
mat freq=r(valid)
matrix rownames freq=`r(lab_valid) '
matrix colnames freq="频率"
mat vper=(freq/r(N_valid))
matrix colnames vper="百分比"
mat vtotal=(r(N_valid),1)
matrix rownames vtotal="总计"
matrix colnames vtotal="频率" "百分比"
matrix coljoinbyname table=freq vper
matrix rowjoinbyname table=table vtotal
putexcel A`rownum'=matrix(table),names hcenter vcenter
local rntable:rowsof table
local rownum=`rownum'+`rntable'+2
putexcel c1:C`rownum',nformat(#.00%) 
}

3.代码解释

use data_analysis,clear

调用数据

putexcel set result.xlsx,sheet("单变量",replace) modify

在工作目录下生成result.xlsx文件,并在其中生成"单变量"的工作表,重新运行代码时,replace更新工作表中内容,modify表示修改excel文件

local rownum=1
local rntable=1

设置初始暂元rownumrntable的值,用于后续循环

local frevar "P4Q3 P4Q6 P4Q7 P4Q8 P4Q9 P4Q10 P4Q11 P4Q1 P4Q2 P4Q16"

将要进行频率分析的变量名存至暂元frevar中,后续循环中循环这个暂元中的变量就可以进行相同的处理了,这里的变量可以随意增加

foreach var of varlist `frevar'{

开始循环

fre`var',nov

命令fre需要自行安装,ssc install fre

可以对数值型或者文本型的变量都进行频率分析,novalue选项表示结果中不显示值,只显示值标签,结果如下:

fre.png

可以存储值标签或者文本型变量的分类文本,通过输入return list可以看到上述命令存储的结果:

fre存储结果.png

其中,r(N)为样本总量,r(N_valid)为有效样本量,r(N_missing)为缺失值数量,r(r)为总的类别数量,r(r_valid)为有效值类别数量,r(r_missing)为缺失值类别数量,r(depvar)为变量名,r(label)为变量标签;

r(valid)为有效样本频率结果矩阵,通过输入matlist r(valid)可以知道矩阵内容:

矩阵.png

有这些结果进行组合就可以生成想要的频率分析结果了~

putexcel A`rownum'="`r(label)'",hcenter vcenter txtwrap bold

由于最开始循环时暂元rownum为1,所以,表示,在excel的单变量工作表中的A1单元格导入变量标签,hcenter vcenter txtwrap bold分别表示单元格水平居中,垂直居中,自动换行,以及加粗

变量标签.png
mat freq=r(valid)
matrix rownames freq=`r(lab_valid) '
matrix colnames freq="频率"

频率结果矩阵:
第一句:将矩阵r(valid)命名为freq
第二句:将矩阵freq的行名称改为值标签
第三句:将矩阵freq的列名称改为“频率”

结果如下:


矩阵freq.png
mat vper=(freq/r(N_valid))
matrix colnames vper="百分比"

生成百分比矩阵:
第一句:矩阵计算,将矩阵freq除以有效样本量,得到矩阵vper
第二句:把矩阵vper的列名改为”百分比“
结果如下:


矩阵vper.png
mat vtotal=(r(N_valid),1)
matrix rownames vtotal="总计"
matrix colnames vtotal="频率" "百分比"

合计结果矩阵:
第一句:生成矩阵vtotal,该矩阵为1行2列,值分别为有效样本量和1
第二句:将矩阵freq的行名称改为"总计"
第三句:将矩阵freq的列名称改为“频率”和"百分比"
结果如下:


矩阵vtotal.png
matrix coljoinbyname table=freq vper
matrix rowjoinbyname table=table vtotal

将上述三个矩阵进行拼接:
第一句:矩阵fre和vper进行拼接,增加列数,生成矩阵table
第二句:矩阵table和vtotal进行拼接,增加行数,更新矩阵table
结果如下:


矩阵table.png
putexcel A`rownum'=matrix(table),names hcenter vcenter

将矩阵table导出到excel中,同上,由于最开始循环时暂元rownum为1,所以,表示,在excel的单变量工作表中的A1单元格导入矩阵table,names分别表示将矩阵的行列名称均导出
结果如下:

频率结果.png

local rntable:rowsof table
local rownum=`rownum'+`rntable'+2

更新暂元rntable:将矩阵table的行数存至rntable
更新暂元rownum:将之前的rownum值加矩阵table的行数再加2,
(例如,循环第一个变量时,rownum为1,rntable为3,则此时rownum为6,循环下一个变量的时候就可以从A6开始导入)

putexcel c1:C`rownum',nformat(#.00%) 

将C列,即百分比这列的格式设置为保留两位小数的百分比格式
结果如下:


百分比格式修改.png

4.最后效果

跑上述代码的效果(多个变量P4Q3 P4Q6 P4Q7 P4Q8 P4Q9 P4Q10 P4Q11 P4Q1 P4Q2 P4Q16),


多个变量频率结果.png

5. 补充

  • 根据实际需求修改,最终可实现批量导出多份数据的多个变量的频率结果~

  • 其实,putexcel命令stata15就有了,一直没有仔细研究,现在发现这和分析后的存储结果以及矩阵很相关~感觉更理解stata里的矩阵了。

  • 目前,还体验过的stata16其他功能:

    1. do文件:自动补全命令;
    2. 数据编辑窗口:可以手动调节宽度;
    3. 和python的交互,这样可以用python爬数据后用stata进行统计分析,或者用stata将分析结果导出excel,再用python进行调整;(刚学完python爬数据,到时候再写写stata和python的交互)
    4. 可以在内存中同时存多个数据,命令frame;
  • 预期接下来:
    stata结果导入excel-多重响应
    stata结果导入excel-交叉分析
    stata结果导入excel-描述统计
    stata结果导入excel-方差分析

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,265评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,078评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,852评论 0 347
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,408评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,445评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,772评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,921评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,688评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,130评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,467评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,617评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,276评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,882评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,740评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,967评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,315评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,486评论 2 348

推荐阅读更多精彩内容