Tamborero D, et al., A Pan-cancer Landscape of Interactions between Solid Tumors and Infiltrating Immune Cell Populations. Clin Cancer Res 2018.
文章方法学
step1
对9174个样本包括了29种癌肿,对16种肿瘤浸润的免疫细胞+cytotoxic cells进行了分析。
step2 对比评价多种TILs的分析方法
2.1计算主要分为两种方法:基因富集法vs去卷积分法(cibersort)
总结来:去卷积分法方法固定,不够灵活,最终只是几个相对百分比值。而基因富集法更加灵活,可以私人订制自己研究,最后是给出一个免疫细胞评分.
此外,他认为cibersort不适合用于RNA-seq的数据,而适合用在microarray的数据上。他还使用了一种方法将RNA-seq的数据转化为microarray的方法。但最终的数据显示cibersort这种去卷积分法的效果没有基因富集法来的优秀。
所以,文章最终选取了基因富集法。
2.2 基因富集法有三种,作者综合了各种计算方法的优劣,选择了将两种方法学进行了综合运用。
这16种细胞的gene expression signature是来自于两种算法的综合
这里作者使用了GSVA对免疫细胞进行评分
中度正相关 | 高度相关和高度负相关,作者觉得不好直接放弃 | 高度正相关 |
所以最终作者使用的immune cell gene expression signature中绝大多数是使用了方法一,少部分方法三,没有方法二。
Step3 采用免疫细胞GSVA score作者对样本进行了聚类分析,最终将肿瘤免疫表型分为了6类。
Step4 免疫分型和临床相关性的研究(理解Figure1D中的火山图)
第一:作者做了每个癌肿的关于免疫分型于临床相关性指标的linear regression。
比如LUAD(肺腺癌):将x设定为每个肿瘤样本的分期stage,y设定为每个样本的immunophenotype。就可以计算每一个相关系数。也就是图figure1D中的effect size
第二:q vaule的计算方法
第三: 每个癌肿的effect size 和q vaule就可以画出下面的火山图。
描述了immunophetype 和其他指标之间的关系
Step5 Driver genes 和immunophetype的关系
使用logistic regression计算出每个癌肿的driver gene于immunophotype的相关性(Y=1-6的免疫表型,X=某个基因如tp53是否有突变(0,1))
气泡图中气泡的有无代表了是否相关,气泡的颜色代表了于哪个免疫类型相关(1-6型)。气泡大小代表了相关相关系数magnitude
Step6 功能聚类,对不同的immunophetype进行GSVA功能聚类分析
Figure3C 表示的是每个癌种不同的immunophetype(不同的颜色)是否在相应的通路上有富集。
类如最左下角的蓝色表示,在2型immunophetype上的 LUSC在TGFβ信号通路上富集
Figure3B是figure3C的横向叠加,大小表示这条通路上富集的癌种的数目
Figure3A是富集的基因占整个pathway的比例。