表型数据的描述性统计,是对表型数据进行的基础分析,包括最大值、最小是、均值、方差、极差等。通过SPSS、Excel或者R都可以完成,R与其他两种方法对比,只需要简单的命令就可以完成全部分析,这里主要介绍R包'psych'。
1.准备工作:
1.1 R包安装
> install.packages('psych')
1.2 数据格式
这里的数据格式为常用的长数据,即第一行为表头,每一列为性状观测值的名称,如株高、茎粗、分枝数、千粒重等。
我这里的数据分别为:株系,时间,重复,年份,之后为每个性状的测量值。
2.统计:
调用R包:
> library('psych')
读取宽数据:
> raw_data <- read.table("phe.txt", header = T, check.names = F, sep = "\t")
我需要每个时间点单独统计,提取时间:
> T1 <- subset(raw_data, Time == 'T1')
统计,这里第五列开始为我需要的表型性状:
> T1_data_desc <- describe(T1[,5:ncol(T1)])
查看结果:
> head(T1_data_desc)
vars n mean sd median trimmed mad min max range skew kurtosis se
TL 1 728 21.24 13.59 19.30 20.00 13.43 0 100.17 100.17 1.04 1.97 0.50
PA 2 728 1.80 1.11 1.63 1.69 1.02 0 7.17 7.17 0.98 1.27 0.04
SA 3 728 5.65 3.48 5.11 5.32 3.22 0 22.52 22.52 0.98 1.27 0.13
结果中包含每个性状在T1时间点的平均值,标准差,最小值,最大值,偏度,峰度等我们需要的所有描述性统计结果。
3.结果输出:
将上一步的描述性统计结果输出:
> write.csv(T1_data_desc, file = "T1_data_desc.csv", quote = F)
引用转载请注明出处,如有错误敬请指出。