最近在用R最相关性分析,主要考虑到宏基因组丰度数据和环境因子之间的关系,这里做一下记录
pearson相关系数:适用于连续性变量,且变量服从正态分布的情况,为参数性的相关系数。
spearman相关系数:适用于连续性及分类型变量,为非参数性的相关系数。
由于是数据情况,经过正态性检验,发现不符合正态分布,所以考虑spearman相关系数
使用R包psych
```
library(psych)
rm(list = ls())
envdata <- read.csv("理化性质-无偏差.csv")
rownames(envdata)<-envdata[,1]
envdata<-envdata[,-1]
envdata<-as.matrix(envdata)
sampledata <- read.csv("aro_abun.csv")
rownames(sampledata)<-sampledata[,1]
sampledata<-sampledata[,-1]
sampledata<-as.matrix(sampledata)
result=corr.test(envdata,sampledata,method = "spearman",adjust="fdr")
```
重点是:
result=corr.test(envdata,sampledata,method = "spearman",adjust="fdr")
result中r为相关系数矩阵,p为p-value矩阵,可以画热图