作者,Evil Genius
时光荏苒,2022年也即将结束,这一年,单细胞空间多组学技术进一步带领我们走入生物组织的微观世界。单细胞多组学的技术发展让研究人员可以从单个细胞的维度进行遗传学、转录组学、蛋白组学等方面的深入解析,空间多组学则从细胞空间排布的角度帮助研究者洞悉细胞之间的相互协作及动态迁移,单细胞空间技术的联合使用已经成了科研手段的研究利器,从更深层次的方面解读发育、疾病等发生的生物学机制。
肿瘤的发生在很大程度上仍然是未解之谜,肿瘤的个体差异、侵袭性和内部异质性也成为攻克肿瘤的世界性难题,了解细胞癌变过程和产生区域可以提高对肿瘤如何生长和发展的理解。在基因组上对于肿瘤样本的分析,CNV研究占了很重要的一部分,对单细胞空间分析而言,识别肿瘤细胞和发生的CNV事件同样重要,包括它在遗传上如何随着时间的推移发生变化。
单细胞组学角度的CNV分析
从单细胞转录组数据分析识别肿瘤细胞的CNV发生事件及遗传变化,常用的分析方法包括inferCNV和copycat,以确定体细胞大规模染色体拷贝数改变的证据,例如整个染色体或大段染色体的gain或loss。其中的原理则是通过与“正常细胞”相比,研究基因组相对位置上的表达强度差异来完成的,实际研究中,肿瘤基因组哪些区域的过度或更少表达通常变化显著,如下图:
从单细胞数据种判断CNV事件通常需要以下步骤:
(1) 单细胞数据的基础分析及细胞注释: CNV分析是针对肿瘤细胞的分析,通常是上皮或者内皮细胞,因而需要先鉴定细胞类型。
(2) 选择合适的reference:选择参考原则上是要选择对应的细胞类型,例如分析上皮细胞癌变的情况,那么应该选择正常的上皮细胞作为refernece,但是在实际情况中,样本通常都是肿瘤组织样本 + 癌旁,正常的组织样本一般无法取到,所以退而求其次,选择免疫细胞等细胞类型作为reference。
(3) 基因排序和算法处理:CNV的分析原理要求确定基因在染色体上的具体位置,并且以reference表达基因的上下游50个基因(默认)的表达平均值作为“基线”,判断肿瘤细胞的gain和loss事件。
(4) CNV的最终判定
单细胞组学角度分析CNV的遗传进化
CNV的分析结果表征了肿瘤细胞的CNV事件,但是细胞之间的CNV事件往往存在差异,有的细胞类型积累的CNV事件较多,而有的细胞癌变程度较轻,这样的分析结果需要对肿瘤的克隆进化进行研究,希望能够得到肿瘤细胞演化的整个过程,这个时候需要构建肿瘤的发育进化树,如下图[1]:
肿瘤进化树要说明的问题集中在CNV事件的发生早晚,每个进化树主干对应早期发生的CNV事件,下方的分支则是后期发生的,而且在后期的CNV事件中体现了不同的进化方向,从转录组的角度来看就是肿瘤内部的异质性。其中蕴含的逻辑就是CNV事件是不断积累的过程,如果某个CNV事件积累的越多,说明发生的事件点越早,而积累较少的CNV事件则是后期时间点产生的。
单细胞组学角度分析CNV的空间缺失
肿瘤不断演化的过程不是随机的,而是受到周围微环境的影响,但是在缺失空间信息的前提下无法了解最初肿瘤细胞发生的位置,以及各种下游异质性的肿瘤细胞的空间迁移变化,所以在CNV分析的基础上,更加需要空间信息的力量来进一步推动肿瘤的研究。
空间组学角度的CNV分析
目前根据空间组学数据推断CNV已有多篇文献报道,在文章Comprehensive analysis of spatial architecture in primary liver cancer[2]中,将空间转录组正常的组织区域作为reference推断每个肿瘤spot的CNV,并且辅助WES的数据验证CNV推断的准确性,如下图: