计算不同样本类型的T置信区间
- 配对样本T置信区间,使用自带的sleep数据:
data(sleep)
g1<-sleep$extra[1:10];g2<-sleep$extra[11:20];diff<-g2-g1
mn<-mean(diff);s<-sd(diff);n<-10
mn+c(-1,1)*qt(0.975,n-1)*s/sqrt(n) ##置信区间计算原理
## [1] 0.7001142 2.4598858
- 使用函数的方法
t.test(diff)$conf[1:2]
## [1] 0.7001142 2.4598858
t.test(g2,g1,paired=T)$conf[1:2]
## [1] 0.7001142 2.4598858
t.test(extra~I(relevel(group,2)),paired=T,data=sleep)$conf[1:2]
## [1] 0.7001142 2.4598858
- 同方差独立组的T置信区间
t.test(extra~I(relevel(group,2)),paired=F,data=sleep)$conf[1:2]
## [1] -0.2054832 3.3654832
- 异方差独立组的T置信区间
如果不确定两组样本是否同方差,则可以假设两组样本异方差,对应计算方法如下
- 单样本T检验
t.test(rate,mu=0.1)
- 两样本T检验
双样本T检验需要满足的前提条件:观测之间相互独立;每组均服从正态分布
这里需要注意两组方差的异同,方差相同与方差不同对应的T统计量的计算公式是不一样的。
-
方差的异同可以通过方差齐性检验判断。检验原假设:两个样本方差相同
双样本T检验流程
根据两样本数据或者是分组变量计算相应的均值
进行方差齐性检验
进行双样本T检验,根据方差齐性检验的结果设置T检验的参数
R代码实现: 方差齐性检验 #先做方差齐性检验
var.test(avg_exp~gender)
R代码实现:T检验 #后做T检验
t.test(avg_exp~gender,var.equal=T) #如果方差齐,equal选择true
方差分析:用于探讨连续型变量和分类型变量之间的关系
- 各组样本均服从正态分布或逼近正态分布。
- 各组样本必须相互独立
- 各组的方差必须相等
- 原假设:均值相等,无差异
- 描述
par(mar=c(4,4,1,4))
boxplot(avg_exp~edu_class) #图像描述
单因素方差分析
anova(lm(avg_exp~edu_class))
```
多因素方差分析
```
anova(lm(avg_exp~edu_class+gender+edu_class*gender))
```
##相关分析
- 数据描述
```
par(mar=c(4,4,1,4));plot(Income,avg_exp)
abline(lm(avg_exp~Income))
```
- 计算相关系数
```
cor.test(Income,avg_exp,method='pearson/spearman')
```
##卡方检验
- 数据描述
```
library(prettyR) #加载相关包
xtab( ~bankruptcy_ind+bad_ind)
```
- 计算chisq
```
xtab( ~bankruptcy_ind+bad_ind,data=accepts,chisq = T) #直接在交叉表里显示卡方
chisq.test(x=accepts$bankruptcy_ind,y=accepts$bad_ind)
```