#单细胞文献综述阅读
#DOI: https://doi.org/10.1016/j.molcel.2017.01.023
#Molecular Cell
#IF (2022):13
Highlights
这篇文章呈现了较为全面的scRNA-seq方法比较
主要是6种方法的选择
对于未来protocol提升提供框架
Summary
本文采用583鼠胚胎干细胞评价了6种scRNA-seq方法:CEL-seq2, Drop-seq, MARS-seq, SCRB-seq, Smart-seq and Smart-srq2.Smart-seq2检测到更多的基因/每个细胞,CEL-seq2,Drop-seq,MARS-seq and SCRB-seq定量mRNA因为UMIs有更少的扩增noise。在power simulations方面,Drop-seq是更加有效的对于大量细胞的转录定量,而MARS-seq,SCRB-seq和Smart-seq2是更加有效的分析少量细胞。
Introduction
scRNA-seq requires the isolation and lysis of single cells, the conversion of their RNA into cDNA, and the amplification of cDNA to generate high-throughput sequencing libraries. scRNA-seq conducted in the small volumes available in the automated microfluidic platform from Fluidigm (C1 platform) outperforms CEL-seq2, Smart-seq, or other commercially available kits in microliter volumes. Furthermore, the Smart-seq protocol has been optimized for sensitivity, more even full-length coverage, accuracy, and cost, and improved Smart-seq2 protocol has also become widely used.
Additionally, this approach allows the incorporation of unique molecular identifiers (UMIs), random nucleotide sequences that tag individual mRNA molecules and, hence, allow for the distinction between original molecules and amplification duplicates that derive from the cDNA or library amplification. Utilization of UMI information improves quantification of mRNA molecules, and it has been implemented in several scRNA-seq protocols, such as STRT, CEL-seq, CEL-seq2, Drop-seq, inDrop, MARS-seq and SCRB-seq.
历史发展进程
单细胞的难点在于基因组扩增和转录组扩增在建库过程中检测限度的问题。单个细胞的DNA含量只有6pg,而基因组建库下限为1ng。
全基因组建库方法的区别
DOP-PCR
利用3‘端含有6bp简并寡核苷酸尔5’端位正常的随机引物,该引物的3‘端可以随机的和基因组DNA结合,从而实现对全基因组的扩增。
MDA
基于等温反应的扩增技术,依赖于链置换扩增原理,利用φ29 DNA 聚合酶扩增基因组 DNA。φ29 DNA 聚合酶具有 3' 到 5' 外切酶活性和校对活性,并且具有特殊的多重置换和连续合成特性。MDA 技术能够对全基因组进行高保真的均匀扩增,仅依靠极少的 DNA 便能扩增到足够测序的 DNA 量。
MALBAC
多次退火环状循环扩增技术,是一种拟线性扩增技术,减少了指数扩增的序列偏好性。扩增引物 5' 端含有 27bp 的相同序列,而 3' 端是 8bp 的随机序列,该扩增引物可以与原始模板在 15-20℃ 下低温结合,然后再进行 8-12 次循环,该过程为拟线性扩增,扩增的产物具有完整的末端,可以发生环化而不被复制。在扩增完成后再对这些环状的扩增子进一步进行指数扩增。
Fluidigm C1单细胞制备系统
Fluidigm C1基于微流控技术(IFC),是世界上第一台用于单细胞基因组学研究的单细胞自动化制备系统,单张芯片一次运行可产出96个单细胞基因组文库(C1 DNA Seq IFC),或96个(C1 mRNA Seq IFC)至800个(C1 mRNA Seq HT IFC)单细胞转录组文库。该仪器还具备开放实验流程设计功能,满足个性化的单细胞研究需求。
RNA建库方法
CEL-seq
CEL-seq(Cell expression by linear amplification and sequencing)是一种采用线性扩增的常用测序方法。低通量的单细胞测序方法。线性扩增的主要优势是错误率比较低,不过线性扩增和PCR都存在序列依赖性偏好。发表于2012年,主要是分离单细胞。CEL-seq 的具体操作:分离单细胞后,利用含唯一条形码(barcode)的引物对每管的单细胞进行逆转录,而该引物含有锚定的ployT、一个特异的条形码、5' Illumina 测序接头和一个T7 的 promoter。获得反转的第二链后,进一步在体外对所有的cDNA以及有效模板进行混合和体外转录(In vitro transcription, IVT),这样就可以对扩增的RNA进行双向的RNA文库进行构建。扩增好的RNA进一步进行片段化(适合测序的片段长度),同时在RNA的 3' 加接头(Adaptor)。进一步对这些RNA进行反转录为 DNA,同时进行 PCR 扩增,扩增后的片段即为建好的库,然后对这些片段进行 paired-end 测序。一端测序可以识别条形码,而另一端测序则可以识别 mRNA。
CEL-seq2对CEL-seq进行了优化,加入了UMI,进行3端优化。
Drop-seq
Drop-seq(液滴测序)是一种基于使用微流体技术快速分析数千个单细胞的方法,Drop-seq 测序的原理是利用微流控装置将带有条形码的微珠和细胞一起装入微液滴,该微液滴相当于一个纳升大小的反应室,可以将单个细胞进行分离,从而单独进行建库和测序。
Drop-seq 包括以下六个步骤:1)从组织中制备单细胞悬液;2)使用微流体装置将每个细胞和带有条形码的微粒进行封装;3)封装在液滴中后,裂解细胞;4)mRNA与微粒结合,形成 STAMPs(single-cell transcriptomes attached to microparticles)5)反转录,扩增和测序成千上万的STAMPs;6)利用STAMP的条形码识别每一个转录本的细胞来源。
MARS-seq
MARS-seq(massively parallel single-cell RNA sequencing)也是一种常用的单细胞转录组建库和测序方法,该方法首要的特点就是通量大,可以同时检测多个细胞。另外,该方法在检测基因表达方面也具有较高的准确性和灵敏性。
MARS-seq 的原理与 CEL-seq 类似 ,均是通过 T7 启动子连在 oligo dT 引物上,可以在 cDNA 合成后启动 IVT(in vitro transcription )。但与 CEL-seq 不同的是,MARS-seq 在单细胞分离时,主要使用的是 FACS 流式分选,而 CEL-seq2/C1 单细胞采用细胞稀释法。
SCRB-seq
SCRB-seq(Single-cell RNA barcoding and sequencing)与 Smart-seq 相似,均是通过 PCR 的方式对扩增 cDNA 进行扩增,但与 Smart-seq 不同的是,SCRB 采用 UMI 主要对 RNA 3' 进行富集,而 Smart-seq 对 mRNA 的全长进行分析,两者还是不一样的。SCRB-seq 的主要流程为:1)FACS单细胞分选后,加入微孔中;2)裂解细胞。反转录为 cDNA,引物含有 oligo dT、10bp UMI、6bp barcode 以及 PCR 引物部分;3)第二链的扩增,主要采用PCR的方式进行扩增;4)进一步对扩增后产物进行PCR指数扩增;5)PCR产物片段化并进行3' 端富集;6)建库测序。
SMART-seq
SMART-seq(Switching mechanismat 5’ end of the RNA transcript),其检测mRNA全长,用于等位基因特异性表达,SNV检测或者剪接变体等深入研究是非常重要的。
莫洛尼鼠类白血病病毒逆转录酶(moloney murine leukaemia virus reverse transcriptase,MMLVRT):同时具有模板转换和末端转移酶的活性,其在转录到mRNA的5’端末端的时候,会在新合成的cDNA的3’末端,多出几个C碱基。
特殊的引物设计:引物序列(5’AAGCAGTGGTATCAACGCAGAGTACT(30)VN3’,V代表A、C或G,N代表A、T、C或G),两个末端核苷酸将引物锚定在poly(A)尾巴的开始处,这样就保证了逆转录的起始位置正好是mRNA的3’端的序列终止位置。
引物2对所加的C碱基进行互补配对,然后引导MMLVRT再次发挥聚合作用,得到双链cDNA。
cDNA合成之后,进行12-18个循环的cDNA PCR扩增(100 pg的总RNA,需要15个循环,对于10 pg的总RNA,可以进行18个循环),将扩增的cDNA用于构建标准的Illumina测序文库。
SMART-seq2
扩增原理:使用oligo(dT) primer对带有polyA尾的RNA进行反转录,由于使用鼠源的反转录酶(MMLV)进行反转录,所以会在cDNA链3‘端加上3个C;模板置换,使用TSO引物合成了cDNA的二链,从而置换了一链cDNA互补的RNA;使用ISPCR primers进行PCR扩增,然后打断cDNA,构建Illumina测序文库,上机测序。
TSO引物序列(5’-AAGCAGTGGTATCAACGCAGAGTACATrGrG+G-3’):在5’端带有1个通用引物序列,而在3’末端,有两个核糖鸟苷(rG)和一个锁核苷酸(Locked Nucleic Acid,LNA)修饰的鸟苷(G),可以促进模板转换,进而扩增出完整的cDNA序列。甜菜碱(N,N,N三甲基甘氨酸)是一种高效的甲基供体。在反转录体系中加入甜菜碱,其能够增加转录所需酶(蛋白质)的热稳定性,并通过破坏DNA螺旋的稳定性降低碱基对DNA热融化转变的依赖性。