前面小编给大家介绍了
在介绍ESTIMATE数据库的时候,小编就提到,目前该数据库中只提供25种肿瘤的Stromal score, Immune score和ESTIMATE score这三种分值。(https://bioinformatics.mdanderson.org/estimate/)
那么问题来了,小编前面给大家介绍过☞ TCGA数据库
我们知道截至2022年8月28日,在TCGA数据库中一共收录了72种不同的肿瘤数据。那么如果刚想自己感兴趣的肿瘤在estimate数据库中不提供相应的免疫分值该怎么办?
今天小编就来带大家解决这个问题。在estimate官网的主页上,实际上是给大家提供了安装estimate这个R包的代码的。
#安装estimate
library(utils)
rforge <- "http://r-forge.r-project.org"
install.packages("estimate", repos=rforge, dependencies=TRUE)
安装好这个包之后,我们可以拿一直给大家举例的TCGA-CHOL这套数据给大家讲解一下这个包的使用。恰巧estimate官网上不提供胆管癌这套数据的免疫分值。
estimate这个包背后的原理其实也是基于一些免疫相关基因在不同样本里面的表达情况来计算每个样本的Stromal score, Immune score和ESTIMATE score这三种分值的,所以首先我们必须要得到所有基因的表达矩阵。
然后从完整的表达矩阵里面提取免疫相关基因的表达矩阵,再利用estimate的算法计算三种免疫相关分值。
完整R代码+详细注释+结果☟☟☟