高计及stata应用陈强版第4章_stata简介

title: 高计及stata应用陈强版第4章_stata简介

1.将数据导入stata

(1)用excel复制粘贴,选择第一行是数据还是变量名
(2)file——import,然后导入各种样式的数据
导入后将数据保存为.dta格式

2.变量标签的修改

打开倒数第三个图标,相应的变量标签可以直接修改,注意stata中的变量名一般用小写

3.调用数据及基本操作

(1)调用数据

use D:\Desktop\stata_陈强\nerlove.dta,clear

备注:调动数据,dta数据中不可以出现(1963),否则不可识别
(2)审视数据

d
///观察数据的变量名称、标签等
label data "Nerlove 1963 paper"
///备注此数据集来自Nerlove 1963 paper
list tc q
///查看tc和q的具体数值,如果中间需要停止,可以点击“break”图标
///左侧命令窗口,单击旧命令出现在命令窗口,双击则直接执行
list tc q in 1/5
///罗列tc、q第1~第5个数值
list tc q if q>=10000
///罗列tc和q中所有q大于等于10000的样本
drop if q>=10000
///扔掉所有不符合要求的样本
///注意:删掉的是整个样本,而不是一个数值

4.考察数据的统计特征

sum 
///没有规定要观察的变量,将显示所有变量的obs(number)、mean、min、max
sum q
sum q if q>=10000
sum q,detail
///第一个显示q的obs、mean、min、max
///第三个还会显示百分位数(percentilea)、方差(variance)、偏度(skewness)、峰度(kurtosis)
tabulate pl
///显示pl的经验累积分布函数,tabulate意味“把.....做成表格”
pwcorr pl pf pk,sig star(.05)
///pwcorr意味“pariwise correlation(两两相关)”
///sig表示显示相关系数的显著性水平,即p值(p值代表这个事件为假要推翻它的概率,所以p值越小越好)
///star(.05)表示将显著性水平≤0.05的标上星号

5.作图

(1)画柱状图

histogram q,width(1000) frequency
///histogram意为“直方图”,此命令可以简写为“hist”
///width表示柱状图的宽为1000
///frequency表示纵坐标为频数
kdensity q
///这是连续的经验分布图。kernel是“核心,谷粒”、density是“密度”

(2)画散点图和线性拟合

scatter tc q
gen n=_n
///第一个n是新变量的含义,_n表示第n个观测值
scatter tc q,mlabel(n)mlabpos(6)
///mlabel(n)表示以n作为“mark label”的标签
///mlabpos(6)表示“mark label position”,把标签放在散点6点钟的位置
twoway(scatter tc q)(lfit tc q)
graph save scatter1
twoway(scatter tc q)(qfit tc q)
graph save scatter2
graph combine scatter1.gph scatter2.gph
///lfit含义为“linear fit”(线性拟合)
///qfit含义为“quadratic fit”(二次拟合)
///保存图片
///将两个图片同时展示出来

6.生成新变量

///本章根据模型需要生成新的变量
g lntc=log(tc)
g lnq=log(q)
g lnpl=log(pl)
g lnpf=log(pf)
g lnpk=log(pk)
///产生新的变量
g q2=q^2
///生成平方项
g lnplpk=lnpl*lnpk
///生成交互项
g larg=(q>=10000)
///这个命令经常用于生成虚拟变量。当()中的逻辑语句为真时,取值为1;为假,取值为0
///在书中其实际含义为:产量在10000以上定义为大企业
rename larg large
///修改变量名
///接下来我们想变更大企业为产量在6000以上,但是仍然使用large这个变量名
///方法1:
replace large=(q>=6000)
///方法2:
drop large
g large=(q>=6000)
drop ln*
///删除所有含有ln的变量

7. stata的计算器功能

display log(2)
display normal(1.96)
///句式:display或者dis +表达

8. 线性回归分析

(1)普通线性回归

reg lntc lnq lnpl lnpk lnpf
///_cons表示常数项
///F统计量的p值为0.0000,说明这个回归方程显著性程度很高
///Residual表示残差平方和
///Root MSE表示这个方程的标准误差

(2)线性回归

reg lntc lnq lnpl lnpk lnpf,noc
///不要常数项的回归
reg lntc lnq lnpl lnpk lnpf if q>=6000
reg lntc lnq lnpl lnpk lnpf if large
///只对大企业的样本进行回归
reg lntc lnq lnpl lnpk lnpf if large==0
reg lntc lnq lnpl lnpk lnpf if ~large
///只对小企业的样本进行回归
///~表示逻辑语句“非”

(3)预测拟合值

predict intchat
///计算被解释变量的拟合值,并将其几位intchat
predict el,r
predict el2,residual
///计算残差
///这里也可以看出,如果predict后边什么选项都没有,默认是估计拟合值的

(4)计算估计系数

///这里边lnq的系数是1/r,是规模报酬的倒数,所以可以利用lnq的系数估计规模报酬
display 1/_b[lnq]
///_b[lnq]表示lnq 的OLS系数估计值

(5)假设检验

///由于规模报酬r=1.387,所以认为可能存在规模报酬递增的现象
test lnq=1
///这里的原假设是r=1,即规模报酬不变
///发现p值很小,故拒绝原假设,故认为存在规模报酬递增
test (lnq=1)(lnpl+lnpk+lnpf=1)
///这里原假设有两个:①(lnq=1)②(lnpl+lnpk+lnpf=1)
///依旧发现p值为0,拒绝原假设
test lnpl lnpk
///这里隐含的假设是lnpl=0;lnpk=0
///发现p值很大,0.3多,所以只能接受原假设,这两个系数都为0
testnl _b[lnpl]=_b[lnq]^2
///这里隐含的假设是lnpl的系数是lnq系数的平方
///发现p值很大,0.3多,所以只能接受原假设
///所以你要看你检验的是什么,p值越小,越要拒绝原假设

(6)新增变量图

avplot lnq
///画lnq的新增变量图
avplots
///画所有变量的新增变量图

(7)约束回归

///此部分为约束回归
///如在经济理论“lnpl+lnpk+lnpf=1”的条件下进行回归
constraint def 1 lnpl+lnpk+lnpf=1
cnsreg lntc lnq lnpl lnpk lnpf,c(1)
///“constraint def 1 ”定义约束条件1
///“cnsreg”含义“constraint regression”
cons def 2 lnq=1
cnsreg lntc lnq lnpl lnpk lnpf,c(1-2)
///定义约束条件2
///c(1-2)表明这个回归要同时满足约束条件1-(杠,不是减)2

8. stata命令的存储与调用

///r命令,如summarize调用结果用return list
sum q
return list
display r(sd)/r(mean)
///e命令,估计命令,调用结果用ereturn list
reg tc q
ereturn list

9. stata命令库的更新

(1)ssc意为“statistical software components”,即“统计软件成分”,stata用户写的、Boston college维护的非官方统计程序集散地
(2)update all:更新stata命令库
(3)ssc new:罗列ssc提供的非官方、最新的命令
(4)ssc hot:罗列ssc提供的非官方、最流行的命令
(5)ssc install newcommand:安装ssc非官方命令
(6)help ssc:有关ssc的信息
(7)search keyword和findit keyword都是搜索,后者范围更广
(8)sysdir:system directories,显示stata的安装路径

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,546评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,224评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,911评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,737评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,753评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,598评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,338评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,249评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,696评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,888评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,013评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,731评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,348评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,929评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,048评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,203评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,960评论 2 355

推荐阅读更多精彩内容

  • 初级班助教 共同整理 展金泳(对外经贸)、袁雪倩 (辽宁大学)、王宇桐 (北师大) 更新时间 2019年1月20日...
    展金永阅读 13,244评论 1 17
  • 当哇哇坠地第一声啼哭来到这世界 被呵护,被宠溺,给予世界最伟大的爱 那个人是母亲。 不厌其烦地教你牙牙学语,...
    冯丽荧阅读 309评论 0 1
  • 理发也叫剃头。从出生的孩子剃满月头开始,就和头发打上交道了。 我的发型从小
    lygly9阅读 133评论 0 0
  • 20岁的时候,女孩相信爱情,觉得爱情里他就是全部,有了他好像一切都不是问题,奋不顾身的去恋爱去做一个他身边的小女生...
    物理不好的姑娘最可爱阅读 605评论 14 5