最近发现了一门剑桥大学的单细胞RNA-seq分析课程,读过之后觉得讲得非常全面,将单细胞RNA-seq分析的前世今生讲得非常透彻,因此与大家共享。
课程原链接:https://www.singlecellcourse.org
1.1 单细胞RNA测序概述
RNA-seq可以以高效且经济的方式描述样本中的转录本,它是2000年代后期的一个重大突破并越来越流行,在很大程度上取代了如微阵列等其他转录组分析技术。它的成功部分归功于RNA-seq允许对样本中的所有转录本进行无偏采样,而不是局限于预先确定的转录本集(如微阵列或 RT-qPCR)。
通常,RNA-seq用于由混合细胞组成的样本,称为Bulk RNA-seq,具有多种应用。例如,它可用于表征健康/患病、野生型/突变型或对照/处理样本中组织之间的表达特征,或者在进化研究中,使用不同物种的组织样本的比较转录组学。除了用于转录本定量之外,它还可用于在模式和非模式物种中查找和注释新基因、基因异构体和其他转录本。
然而,通过Bulk RNA测序,我们只能估计细胞群体中每个基因的平均表达水平,而不考虑样本中单个细胞之间基因表达的异质性。因此,它不足以研究异质性系统,例如早期发育研究或大脑等复杂组织。
为了突破这一限制,在单细胞水平上应用RNA-seq(scRNA-seq)的新方法于2009年首次发表(Tang et al. 2009)。这项技术从2014年左右开始变得更加流行,当时新的方法和更低的测序成本使其更容易实现。与Bulk方法不同,scRNA-seq使我们可以估计细胞群体中每个基因的表达水平分布。
这使得我们能够回答转录组中的细胞特异性变化具有重要作用的生物学问题。例如发现新的或罕见的细胞类型、识别健康/患病组织之间的差异细胞组成或了解发育过程中的细胞分化。该技术最具代表性的用途之一是构建基因图谱,它提供了生物体细胞多样性的全面概要,在健康和基础研究领域有许多应用。
单细胞图谱
有许多项目试图提供生物体内细胞的综合图谱。以下是其中一些项目的非详尽列表:
Human Cell Atlas
Tabula Muris
Fly Cell Atlas
Cell Atlas of Worm
Arabidopsis Root Atlas
每个研究的scRNA-seq数据集范围从数百到数百万个细胞,并且逐年增加。目前有多种不同的方法可供选择,既有商业的也有开源的,每种方法都有各自的优点和缺点。我们将在后面章节中讨论其中的一些方面。
1.2 样本准备方法
广义上讲,典型的scRNA-seq方法包括以下步骤:
- 组织解剖和细胞解离以获得细胞悬浮液。
- 选择细胞(例如基于膜标记、荧光转基因或染色)(可选)。
- 将单个细胞捕获到单独的反应容器中(例如孔或油滴)。
- 从每个细胞中提取RNA。
- 将RNA逆转录为更稳定的cDNA。
- 扩增cDNA(通过体外转录或PCR)。
- 使用适当的分子接头构建测序文库。
- 测序,通常采用双端Illumina方法。
- 处理原始数据以获得细胞x基因计数矩阵。
- 进行几项下游分析(本课程的重点)。
本课程主要涉及此工作流程的最后一步,但之前的一些步骤也很重要,因为它们会影响我们获得的数据的属性。
单细胞核RNA-seq
在细胞分离困难的组织或冷冻组织样本中,可以分离单个细胞核而不是整个细胞。除分离步骤外,准备单细胞核测序文库的方法与单细胞方法类似。然而,核RNA通常含有更高比例的未加工RNA,并且更多的测序转录本含有内含子。在数据处理步骤中需要考虑这一方面,我们将在下一章中详细介绍。
目前,用于准备scRNA-seq数据的方法多种多样,每种方法都有自己的优点和缺点,我们将在下面进行介绍。这些方法可以按照不同的方式进行分类,但最重要的两个方面是细胞捕获或分离和转录本定量。
1.3 细胞捕获
捕获细胞的策略决定了实验的通量、测序之前如何选择细胞、以及除了转录本测序之外还可以获得哪些额外信息。最广泛使用的三种方法是基于微孔板的方法、基于微流体阵列的方法和基于微流体液滴的方法。
微孔板方法依赖于使用例如移液、显微切割或荧光细胞分选(FACS)将细胞分离到板的各个孔中。基于微孔板的方法的一个优点是可以在文库制备之前拍摄细胞的照片,从而提供额外的数据模态。例如,可以识别并丢弃受损细胞或找到含有双胞的孔。当使用自动FACS分选时,还可以将细胞大小和标签强度等信息与孔坐标相关联,从而与下游分析中的单个细胞索引相关联。这些方法的主要缺点是它们通常通量低并且每个细胞所需的工作量可能相当大。
微流体阵列平台(例如Fluidigm的C1)提供了更集成的系统,用于捕获细胞和进行文库制备。因此,它们比基于微孔板的方法提供了更高的通量。通常,微流体阵列平台只能捕获大约10%的细胞,因此不适合处理稀有细胞类型或非常少量的输入。还必须注意阵列捕获的细胞大小,因为纳米孔是针对特定尺寸定制的(因此这可能会影响复杂组织中细胞的无偏采样)。另外,该芯片虽然价格相对较高,但由于反应可以在较小的体积内进行,因此可以节省试剂费用。
微流体液滴方法提供最高的通量,是当今最流行的方法。它们的工作原理是将单个细胞与bead一起封装在纳升大小的油滴内。Bead上装载有构建文库所需的酶和其他成分。具体来说,每个bead都含有一个独特的barcode,该barcode附着在源自该细胞的所有测序read上。因此,可以将所有液滴汇集在一起,一起测序,然后根据这些barcode将read分配给原始细胞。Droplet平台的文库制备成本相对便宜,约为0.05美元/细胞。相反,测序成本往往成为限制因素。
荧光细胞分选(FACS)可用作任何捕获方法的上游,以选择细胞亚群。一种常见的方法是用染料对细胞进行染色,以区分活细胞和死细胞,从而使细胞悬浮液中富集活细胞。
参考文献
Tang, Fuchou, Catalin Barbacioru, Yangzhou Wang, Ellen Nordman, Clarence Lee, Nanlan Xu, Xiaohui Wang, et al. 2009. “mRNA-Seq Whole-Transcriptome Analysis of a Single Cell.” Nat. Methods 6 (5): 377–82. https://doi.org/10.1038/nmeth.1315.
Ziegenhain, Christoph, Beate Vieth, Swati Parekh, Björn Reinius, Amy Guillaumet-Adkins, Martha Smets, Heinrich Leonhardt, Holger Heyn, Ines Hellmann, and Wolfgang Enard. 2017. “Comparative Analysis of Single-Cell RNA Sequencing Methods.” Mol. Cell 65 (4): 631–643.e4. https://doi.org/10.1016/j.molcel.2017.01.023.