The Integrated Genomic Landscape of Thymic Epithelial Tumors. 全文链接
Cancer Cell (IF=23.9,PMID: 29438696),2018 Feb
设计:
117 组TETs-normal 配对样本
TCGA THYM 队列
多组学分析
结论:
识别与TETs相关的基因突变
发现TETs与重症肌无力(MG)之间的分子关联
用新的方法将这117个样本分成四种亚型
Abstract
胸腺上皮肿瘤(TETs)是最罕见的成人恶性肿瘤之一。 在TET中,胸腺瘤是最主要的,其特点是与自身免疫性疾病具有独特的联系,其次是胸腺癌,这种病较不常见,但在临床上更具侵略性。
通过对117个TET进行多平台组学分析,我们定义了这些肿瘤的四个亚型,这些亚型由基因组标志以及与生存和世界卫生组织组织学亚型的关联定义。
我们进一步证明了胸腺瘤特异性突变致癌基因GTF2I的显着患病率,并探讨了其对多平台分析的生物学影响。 我们进一步观察到HRAS,NRAS和TP53中突变的富集。 最后,我们确定了胸腺瘤与自身免疫性疾病重症肌无力之间的分子联系,其特征是肿瘤中的肌肉自身抗原过表达和非整倍性增加
在对117组 tumor-normal配对样本的WES测序,过滤1个超突变样本和16个突变很少的样本后,剩余100对样本数据被用来识别显著的体细胞突变(图1)。
用MutSig2CV方法识别到了四个显著突变的基因: GTF2I, HRAS, TP53, 和 NRAS ,其中GTF2I是突变频率最高、最显著的基因,也是已知的TET突变基因。
图1. TET中DNA突变的情况
图中央的矩阵代表了TET患者的个体突变,这些突变由突变类型按颜色编码,用于显着突变的基因,包括GTF2I,HRAS,NRAS和TP53。
与TCGA分析的其他21种癌症相比,TET在成年癌症中的平均肿瘤突变负担(TMB)最低(平均每兆碱基0.48个突变),只有两种儿科癌症的平均TMB更低(横纹肌肉瘤和髓母细胞瘤)( 图2)。
图2. TET中的TMB(THYM)与TCGA分析的其他21种癌症相比
在图的底部的直方图中描述了按癌症谱系的突变转移和颠换的比例存在。
整合多个TCGA平台的聚类结果,通过改进后的COCA 方法识别出了TETs不同的分子亚型。
图3.来自五个数据平台的子类型的集成无监督聚类
(A)共识聚类将TET样品分为四个分子亚型(n = 117)。 顶部的蓝色和白色热图显示了示例共识。 中心的蓝色和黄色热图显示了与每个单独的数据类型集群成员质心的相关性。 底部显示了四个显着突变的基因之一中突变的存在(黑色)或不存在(灰色)。
(B)按WHO组织学亚型分类的各组样本摘要。
(C)跨分子亚型的生存差异。 第3组中的样本缺少生存数据。
(D)从TumorMap产生的样品的图谱按病理状态着色。 根据相似性将样品放置在整合所有平台的基因组图谱中。 对于每个群集,单平台标记在细线上方列出,而PARADIGM结果在细线下方列出。
GTF2I的多平台分析
图4.胸腺瘤特异性癌基因GTF2I的多平台分析
(A)GTF2I的棒棒糖图,显示了在GTF2I中观察到的所有突变。 绿框标记了类似GTF2I的重复区域。
(B)与TET相比,其他癌症谱系中GTF2I的体细胞突变频率。
(C)在A型和AB型胸腺瘤中的GTF2I突变基因表达特征。
(D)A和AB型的GTF2I甲基化标记。 根据RNA序列数据,还报告了10个分类错误的样品。
(E)GTF2I突变(红色)和野生型(蓝色)肿瘤的途径得分的箱线图。 箱线图显示中位数,上四分位数和下四分位数,胡须表示四分位数范围,离群值用点标记,p值基于ANOVA测试。
自身免疫 肌无力
图5. sCNA模式和与自身免疫相关的基因表达
(A和B)比较了所有组织学类型(A)和B1,B2,B3中仅样本子集的重症肌无力的阳性(MG +)和阴性(MG-)状态的染色体臂发生率 组织学类型(B)。 对于箱线图:框中的线表示中位数; 下部和上部铰链分别与第一和第三四分位数相对应; 上下晶须延伸至1.5倍四分位间距; 离群数据显示为点。
(C)具有B1,B2,B3组织学的样本的基因水平sCNA频率分布图,比较重症肌无力状态的历史。 将独立性的χ2检验应用于每个染色体臂的臂级sCNA,以确定MG +和MG-状态之间的显着富集事件。 错误增益(q)小于0.05(-log q值= 3)显示为增益(红色)和删除(蓝色)。
(D)选定差异表达基因的Log2归一化基因表达。
胸腺癌
n=10
图6.胸腺癌的基因组分析(A)TC型肿瘤中DNA突变的情况。 面板顶部的矩阵描述了临床信息。 面板的中心描绘了TC类型的肿瘤中的个别突变,这些突变按突变类型进行了颜色编码,用于先前确定的显着突变的基因和病灶拷贝数变化。 面板的下半部分描述了按CNA类型编码的每个样本颜色的手臂级sCNA。 左侧的条形图描述了每个样本的总sCNA数。(B)通过组织学展示样品TMB的箱线图。 方框中的线表示中位数; 下部和上部铰链分别与第一和第三四分位数相对应; 上下晶须延伸至1.5倍四分位间距; 离群数据显示为点。 为了避免歪曲结果,排除了1个超突变TC样本和1个TMB = 0的TC样本。
(C)COSMIC签名6(微卫星不稳定肿瘤)的归一化谱图和超突变TC样品(TCGA-ZB-A966)的SNV突变谱,沿96个碱基的替换类型在三核苷酸序列基序中(顶部)和 TCGA-ZB-A966中的突变谱与30个策划的COSMIC签名之间的余弦相似度。
Summary
多组学:
sCNV, mRNA, miRNA, DNA甲基化和反向蛋白阵列(RPPA)数据
亚型
免疫相关分析(MG)