【看文章涨姿势(一)】肺癌的T细胞免疫图谱

1. 简介

肺癌是一种非常常见的恶性肿瘤,其发病率和致死率在男性中一直位居恶性肿瘤之首。一般来讲,肺癌主要分为小细胞肺癌(约占15%)和非小细胞肺癌(Non-small-cell lung cancer,NSCLC)两大类,而其中非小细胞肺癌又可以分为腺癌(约占40%)、鳞状细胞癌(约占30%)和大细胞癌(约占15%)

Material:

研究人员对来自14个药物治疗前非小细胞肺癌患者的外周血癌旁组织癌组织的12,346个T细胞进行了单细胞转录组测序,全面描绘和解析了肺癌T细胞群体的组成、谱系以及功能状态图谱

使用 CD3, CD4, CD8 和 CD25 的抗体分离富集对应的T细胞:

  • 细胞毒性T细胞:CD3+CD8+
  • 辅助T细胞:CD3+CD4+CD25low/int
  • 调节性T细胞:CD3+CD4+CD25high

Result:

  • 跨组织分布的T细胞类群

  • 肿瘤浸润T细胞的组成

  • 肿瘤浸润T细胞亚群间潜在的状态转换关系

  • 提出了新的肺腺癌临床标志物

补充知识:特异性免疫应答的过程

2. 结果

2.1. 亚群分类

对所有样本的原始的表达谱使用t-SNE方法进行降维

得到的聚类结果可以看到与样本的组织来源和亚型相关

为了得到内部的亚群,对上一步得到的降维结果进行无监督聚类(densityClust,一种基于密度的聚类算法,类似于Mean-shift)

Mean-shift算法

Mean-shift 聚类是一个基于滑窗的算法,尝试找到数据点密集的区域。它是一个基于质心的算法,也就是说他的目标是通过更新中心点候选者定位每个组或类的中心点,将中心点候选者更新为滑窗内点的均值。这些候选滑窗之后会在后处理阶段被过滤,来减少临近的重复点,最后形成了中心点的集合和他们对应的组。查看下面的说明图:

单滑窗的 Mean-Shift 聚类

得到16个主要的亚群(亚群名称的最后部分为与该类聚类中心重合的基因的名称),其中:

  • 7个位 CD8+ T 细胞亚群;
  • 7个为CD4+ T 细胞亚群(Tconvs; C1, C2, C3, C4, C5, C6 and C7 of CD4 clusters);
  • 2个调节性T细胞亚群(Tregs; C8 and C9 of CD4 clusters);

在这么多clusters中,文章重点关注上图中圈出的6个具有明显生物学意义的6个clusters

2.2. 不同的细胞亚群存在明显的组织来源特异性

使用卡方检验来定量描述这种组织来源偏好性

卡方检验(chi-square test):

描述是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。

在本研究中采用样本中某类亚群细胞的实际检测数与其随机检测到的期望个数的比值的卡方值RO/E来描述这种偏差

例如,CD8-C1-LEF1 与 CD4-C1-CCR7 都是 naïve T 细胞,它们都富集在外周血中;而CD8-C6-LAYN (CD8+ exhausted T cells) 和 CD4-C9-CTLA4 (CD4+Tregs)只富集在肿瘤组织中; CD8-C3-CX3CR1 和 CD4-C3-GNLY 是效应细胞,富集于外周血和癌旁组织中,其高表达趋化因子受体和细胞毒性因子,而低表达T细胞“耗竭”(exhaustion)标记基因

肿瘤微环境中的杀伤性CD8 T细胞由于长期接受抗原刺激,会出现被称为“耗竭”(exhaustion)的失能状态

2.3. 克隆扩张

对16个亚群的8,038个T细胞进行TCR全长测序,得到5,015条 unique TCRs 和 3,023 条重复的TCRs,这意味着存在克隆扩张的现象

扩张范围在2~75之间(即21~26),根据克隆的分布位置可以分为以下两种克隆扩张类型:

  • 组织内部( intra-tissue)的克隆扩张,某种TCR克隆只在该克隆所在的组织中找到其他相同克隆;
  • 组织间(inter-tissue)的克隆扩张,某种TCR克隆在该克隆所在的组织之外找到其他相同克隆;

大多为组织内部(intra-tissue)的克隆扩张,少数为组织间(inter-tissue)的扩张

不同细胞亚群的克隆扩张的比例

可以看到属于naïve T 细胞的两个亚群 CD8-C1-LEF1 和 CD4-C1-CCR7,它们的克隆扩张比例很低。而属于效应T细胞的两个亚群 CD8-C3-CX3CR1 和 CD4-C3-GNLY,它们不仅克隆扩张比例高,而且有很大比例在外周血、癌旁组织和癌组织中都有分布,如下图:

克隆发生扩张,且在三个组织中都有分布——侧面反映了T细胞克隆在从发生位置到病灶位置转移过程中,边迁移边扩增

进一步研究发现一些涉及细胞粘附与迁移的基因的相对高表达,也从侧面印证了它们存在的迁移特性

3. 可借鉴的分析方法

3.1. 单细胞测序数据处理

  1. 去除核糖体RNA序列

    从RFam数据库中下载核糖体RNA序列,将原始测序数据与其比对,过滤出未比对上的reads

  2. 舍弃低质量的样本数据

    若单细胞的文库太小或检测到的表达的基因的数量太少(阈值设为所有细胞表达基因数的中位数减去3倍的方差),则将整个样本的数据舍弃

    若检测到的CD3的TPM(CD3D, CD3E 和 CD3G 的均值)太低,该样本也舍弃

  3. 鉴定T细胞的克隆型

    TPMCD8 > 30 :CD8+

    TPMCD8 < 3 :CD8-

    TPMCD4 > 30 :CD4+

    TPMCD4 > 30 :CD4-

3.2. TCR分析

使用TraCeR工具,从T细胞转录组数据中组装出完整的TCR序列

3.3. 组织分布偏好性或其他bias类型的分析

可以利用独立性检验来考察两个变量是否有关系,若两个变量之间存在关联性,它们就会以比较大的概率一起出现,从而表现出偏好性

适用于独立性检验(又称关联分析)的统计学方法有

  • 卡方检验(Chi-Square test)

  • Fisher精确检验(Fisher's exact test)

  • 卡方检验

  • Fisher精确检验

    分析男人女人节食是否有显著区别:

    出现上述情况的概率是:

3.4. SC3:单细胞表达谱的无监督聚类

该聚类方法名为SC3(Single-Cell Consensus Clustering)

该方法本质上就是K-means聚类,不过在执行K-means聚类的前后进行了一些特殊的操作:

  • k-means聚类前:进行了数据预处理,即特征的构造,称为特征工程,该方法中是对输入的原始特征空间进行PCA变换或拉普拉斯矩阵变换,对变换后的新特征矩阵逐渐增加提取的主成分数,来构造一系列新特征;
  • k-means聚类后:特征工程构造出来的一系列新特征集合,基于这些新特征集合通过k-means聚类能得到一系列不同的聚类结果,尝试对这些聚类结果总结出consensus clustering

本人比较好奇的地方是:怎么从一系列不同的聚类结果中总结出consensus clustering?

使用CSPA算法(cluster-based similarity partitioning algorithm)

(1)对每一个聚类结果按照以下方法构造二值相似度矩阵S:如果两个样本i和j在该聚类结果中被聚到同一个集合中,则它们之间的相似度为1,在二值相似度矩阵中对应的值 Si,j = 1,否则Si,j = 0;

(2)对所有的聚类结果的二值相似度矩阵S取平均,得到consensus matrix;

(3)基于consensus matrix进行层次聚类,得到最终的consensus clustering;


参考资料:

(1) Guo X , Zhang Y , Zheng L , et al. Global characterization of T cells in non-small-cell lung cancer by single-cell sequencing[J]. Nature Medicine, 2018, 24(7).

(2) Nature Medicine| 张泽民组在单细胞水平绘制肺癌T细胞免疫图谱

(3) AI研习社《数据科学中必须熟知的5种聚类算法》

(4) Stubbington, M. J. T. et al. T cell fate and clonality inference from single-cell transcriptomes[J]. Nat. Methods 13, 329–332 (2016).

(5) 简书·Yan文怡《结合日常生活的例子,了解什么是卡方检验》

(6) CSDN·joey周琦《Fisher's exact test( 费希尔精确检验)》

(7) Kiselev, V. Y. et al. SC3: consensus clustering of single-cell RNA-seq data[J]. Nat. Methods 14, 483–486 (2017).

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,194评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,058评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,780评论 0 346
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,388评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,430评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,764评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,907评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,679评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,122评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,459评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,605评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,270评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,867评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,734评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,961评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,297评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,472评论 2 348