R实战|卡方检验及其可视化
卡方检验
卡方检验是一种以χ 2 分布为基础的用途广泛的假设检验方法。是一种非参数检验方法。卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。它的无效假设H0 为:观察频数与期望频数没有显著性差异。χ2检验主要有三个用途:单样本方差的同质性检验、独立性检验和适合性检验。
独立性检验 (Independence)
独立性检验评估的是,在一个列联表中,不成对的观测对象中的两个变量是不是相互独立的。
适合度检验 (Goodness of fit)
适合度检验展示了一个观察到的频率分布是否与一个理论分布不同。
22
可视化
# 安装并加载ggstatsplot包
install.packages('ggstatsplot')
library(ggstatsplot)
饼图
ggpiestats
该函数为类别变量创建饼图,图的副标题中包含列联表分析的结果(Pearson卡方检验用于受试者间设计,McNemar卡方检验用于受试者内设计)。如果只输入一个类别变量,则单样本比例检验(即卡方拟合优度检验)的结果将显示为副标题。
## 设置种子可重复
set.seed(123)
## 绘制
ggpiestats(
data = mtcars,
x = am,
y = cyl,
package = "wesanderson",
palette = "Royal1",
title = "Dataset: Motor Trend Car Road Tests", ## title for the plot
legend.title = "Transmission", ## title for the legend
caption = "Source: 1974 Motor Trend US magazine"
)
默认 输出
✅ 描述(频率)
✅ 推论统计
✅ 效应量+置信区间
✅ 适合度检验
✅ 贝叶斯假设检验
✅ 贝叶斯估计
grouped_ggpiestats
##单组内
set.seed(123)
grouped_ggpiestats(
data = mtcars,
x = cyl,
grouping.var = am, ##分组变量
label.repel = TRUE,
package = "ggsci",
palette = "default_ucscgb"
)
柱状图
ggbarstats
# install.packages('hrbrthemes')
set.seed(123)
library(ggplot2)
## plot
ggbarstats(
data = mtcars,
x = am,
y = cyl,
title = "Dataset: Motor Trend Car Road Tests", ## title for the plot
legend.title = "Transmission",
xlab = "am",
ggtheme = hrbrthemes::theme_ipsum_pub(),
ggplot.component = list(ggplot2::scale_x_discrete(guide = ggplot2::guide_axis(n.dodge = 2))),
palette = "Set2"
)
grouped_ggbarstats
set.seed(123)
grouped_ggbarstats(
data = mtcars,
x = am,
y = cyl,
grouping.var = vs,
package = "wesanderson",
palette = "Darjeeling2",
ggtheme = ggthemes::theme_tufte(base_size = 12)
)
往期
- 跟着Nature学作图 | 配对哑铃图+分组拟合曲线+分类变量热图
- (免费教程+代码领取)|跟着Cell学作图系列合集
- 跟着Nat Commun学作图 | 1.批量箱线图+散点+差异分析
- 跟着Nat Commun学作图 | 2.时间线图
- 跟着Nat Commun学作图 | 3.物种丰度堆积柱状图
- 跟着Nat Commun学作图 | 4.配对箱线图+差异分析