应用单细胞测序技术研究科学问题越来越普遍,当下应用最火热的是10X Genomics公司的解决方案,但是在某些特殊或者少量细胞样本的单细胞转录组研究中,Smart-seq2技术还是一项研究利器。在Smart-seq2技术基础上衍生的其它单细胞转录组测序技术为某些特殊科学问题提供了解决方案,比如最近发表的mRNA poly(A)尾的多态性研究(Liu et al., 2019)。
测序相关的实验技术创新往往是在以前的实验基础上改进而来,或者是几种实验加测序技术的组合,盖成大楼的不是最后一块砖,每建成一层都能探寻到独特的风景。通过对某些核心测序实验技术Step-by-Step的梳理、传播,我们期望帮助更多的人启发思考,并继续拓展创新。
本文将Step-by-Step梳理Smart-seq2技术的实验原理和文库组成,对于更细节的实验条件和处理将不会涉及,如果对这部分有兴趣可参考文章的protocol(Picelli et al., 2014)
Smart-Seq简介
Smart-Seq
(Switching mechanism at 5' end of the RNA transcript)
- 2012年Smart-Seq发表(Ramsköld et al., 2012)
- 2013年发表了其改进技术的应用Smart-Seq2 (Picelli et al., 2013)
- 2014年Smart-Seq2 protocol发表 (Picelli et al., 2014)。
Smart-Seq2 对原始的Smart-Seq实验流程进行了多项改进优化,它不再需要纯化步骤,可大大提高产量,最重要的改进是下面两项:
- TSO 3'端最后一个鸟苷酸替换为锁核酸LNA(locked nucleic acid)。
LNA单体的热稳定性增强,其退火温度增强非模板cDNA的3'延伸能力 - 甜菜碱(一种具有两个重要作用的甲基供体:它会增加蛋白质的热稳定性,并通过破坏DNA螺旋来降低甚至消除了DNA热融变对碱基对组成的依赖性)与较高的MgCl2浓度结合使用。
解决某些RNA形成二级结构(例如发夹或环)由于空间位阻,可能导致酶终止链延长的问题
Smart-Seq2 优点和限制
优点
- Smart-seq2利用现成的试剂比广泛商用的SMARTer kit生产更高质量的文库,成本便宜~12%,为分析大量细胞提供了可能性
- 相对于截短的cDNAs,M-MLV逆转录酶更倾向于选择全长cDNAs作为其末端转移酶活性的底物。因此每个转录本的所有外显子都能被检测到,这使它可以用于检测可变剪接,还可以在转录本层面进行全面的SNP和突变分析,扩大了其应用范围
- 不同I5、I7 Index组合使其能够进行多样品混合测序
- Smart-seq2的方案组分和原理是公开的,让研究人员可以进一步对其进行改良,目前在这个方案基础上涌现了许多单细胞测序的新成果
限制
- 由于对聚腺苷酸化的RNA具有选择性,所以不能分析非poly(A)的RNA
- 测序reads不带有mRNA链特异性
建库技术原理
我们了解了Smart-seq2的优点和限制,到底怎样的文库结构和实验建库原理使它有这些特点呢?
这一章节我们将Step-by-step详细解读Smart-seq2的文库构建过程
建库流程图总揽
接头和引物序列
- oligo-dTV
5'- AAGCAGTGGTATCAACGCAGAGTACTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTVN -3'
- Template Switching Oligo (TSO)
5'- AAGCAGTGGTATCAACGCAGAGTACATrGrG+G
-3'
- ISPCR
5′- AAGCAGTGGTATCAACGCAGAGT -3′
- Nextera Tn5 binding site (19-bp Mosaic End (ME))
5'- AGATGTGTATAAGAGACAG -3'
- Nextera N/S5xx primer entry point (s5)
5'- <u>TCGTCGGCAGCGTC
</u> -3'
- Nextera N7xx primer entry point (s7)
5'- GTCTCGTGGGCTCGG -3'
- Illumina P5 adapter
5'- AATGATACGGCGACCACCGAGATCTACAC -3'
- Illumina P7 adapter
5'- CAAGCAGAAGACGGCATACGAGAT -3'
- Nextera (XT) N/S5xx Index primer
5'- AATGATACGGCGACCACCGAGATCTACAC[8-bp i5 index]<u>TCGTCGGCAGCGTC
</u> -3'
- Nextera (XT) N7xx Index primer
5'- CAAGCAGAAGACGGCATACGAGAT[8-bp i7 index]GTCTCGTGGGCTCGG
-3'
- Read 1 sequencing primer
5'- <u>TCGTCGGCAGCGTC
</u>AGATGTGTATAAGAGACAG -3'
- Index 1 sequencing primer
5'- CTGTCTCTTATACACATCTCCGAGCCCACGAGAC
-3'
- Read 2 sequencing primer
5'- GTCTCGTGGGCTCGG
AGATGTGTATAAGAGACAG -3'
8-bp i5 & i7 序列
N/S502 : CTCTCTAT
N/S503 : TATCCTCT
N/S505 : GTAAGGAG
N/S506 : ACTGCATA
N/S507 : AAGGAGTA
N/S508 : CTAAGCCT
N/S510 : CGTCTAAT
N/S511 : TCTCTCCG
N/S513 : TCGACTAG
N/S515 : TTCTAGCT
N/S516 : CCTAGAGT
N/S517 : GCGTAAGA
N/S518 : CTATTAAG
N/S520 : AAGGCTAT
N/S521 : GAGCCTTA
N/S522 : TTATGCGA
N701 : TCGCCTTA
N702 : CTAGTACG
N703 : TTCTGCCT
N704 : GCTCAGGA
N705 : AGGAGTCC
N706 : CATGCCTA
N707 : GTAGAGAG
N710 : CAGCCTCG
N711 : TGCCTCTT
N712 : TCCTCTAC
N714 : TCATGAGC
N715 : CCTGAGAT
N716 : TAGCGAGT
N718 : GTAGCTCC
N719 : TACTACGC
N720 : AGGCTCCG
N721 : GCAGCGTA
N722 : CTGCGCAT
N723 : GAGCGCTA
N724 : CGCTCAGT
N726 : GTCTTAGG
N727 : ACTGATCG
N728 : TAGCTGCA
N729 : GACGTCGA
Step-by-step library generation
首先细胞需要制备成单细胞悬液
Poly(A)+ RNA逆转录
oligo-dTVN
经过退火结合到mRNA的poly(A),逆转录酶MMLV开始进行逆转录。
oligo-dTVN
的3'末端含有VN
,其中N
为A/T/C/G任何碱基,V
为A/C/G。这样的设计能够使oligo-dTVN
能够锚定到poly(A)+RNA的3′-UTR末端,从而在逆转录时避免poly(A)尾的逆转录。
逆转录完成后,MMLV的末端转移酶活性会在3'末端增加额外的Cs
模板转换
加入
TSO
引物,TSO
3'末端的rGrG+G结合到第一链的CCC,第一链(非模版链)继续延伸合成TSO的互补链。
TSO
引物的3'末端有2个核糖鸟苷(rG)和一个LNA修饰的鸟苷(+G),这样的设计使LNA单体的热稳定性增强,其退火温度增强非模板cDNA的3'延伸能力
值得注意的是在第一链延伸合成TSO互补链之后,在3'末端又会添加CCC,这样可能又会结合一个TSO,造成意外的模版延长,如下第二种情况
(Kapteyn et al., 2010)
要避免这种情况可以使用5'-blocked TSO,或者降低TSO的投入量
10X单细胞的TSO的5' end是被阻断,所以不存在这个问题
cDNA扩增
添加ISPCR单引物用于cDNA扩增
ps:这步骤得到的是全长的cDNA序列,如果像10X转录组那样在
oligo-dTV
的设计中加入标示细胞的barcode和标示转录本的UMI,那么在细胞和DNA量足够的情况下可以直接应用三代仪器进行单细胞的全长转录本测序,这样得到的每个细胞内的基因检出数和丰度将很可观
cDNA片段化
使用Nextera XT样品制备试剂盒进行cDNA的片段化和标签标记,试剂盒的标记反应利用Tn5的特性把cDNA打断的同时,把
s5
s7
整合到打断后的cDNA片段上上图为Tn5模式图,cDNA片段标签化的产物有以下三种
- 产物1
s5
在片段的两端,根据semi-suppressiev PCR原理,在后续步骤不会有效扩增 - 产物2
s7
在片段的两端,根据semi-suppressiev PCR原理,在后续步骤不会有效扩增 - 产物3
s5 s7
在片段的两端,在后续步骤能够被有效扩增
被Tn5打断标签化之后的文库片段并不完全是双链互补的,在连接处的插入片段末端带有gap,这些gap会在Nextera PCR的第一个循环被填补,填补后的文库组成如下
加入文库PCR引物进行文库扩增
加入N/S5xx and N7xx index引物对上一步标签化的文库进行扩增
最终上机测序文库组成
I5/I7 Index序列信息见上一章节,不同的I5/I7组合能够使来自不同单细胞的文库混合pooling在Illumina仪器的同一个lane上进行测序,在测序数据下机后能够根据I5/I7 拆分来自不同单细胞文库的数据。
参考
- Liu Y, Nie H, Liu H, et al. Poly (A) inclusive RNA isoform sequencing (PAIso− seq) reveals wide-spread non-adenosine residues within RNA poly (A) tails[J]. Nature communications, 2019, 10(1): 1-13.
- Ramsköld D, Luo S, Wang Y C, et al. Full-length mRNA-Seq from single-cell levels of RNA and individual circulating tumor cells[J]. Nature biotechnology, 2012, 30(8): 777.
- Picelli S, Björklund Å K, Faridani O R, et al. Smart-seq2 for sensitive full-length transcriptome profiling in single cells[J]. Nature methods, 2013, 10(11): 1096.
- Picelli S, Faridani O R, Björklund Å K, et al. Full-length RNA-seq from single cells using Smart-seq2[J]. Nature protocols, 2014, 9(1): 171.
- https://www.illumina.com.cn/science/sequencing-method-explorer/kits-and-arrays/smart-seq2.html?langsel=/cn/
- https://teichlab.github.io/scg_lib_structs/methods_html/SMART-seq_family.html
- https://scrnaseq-course.cog.sanger.ac.uk/website/introduction-to-single-cell-rna-seq.html
- Kapteyn J, He R, McDowell E T, et al. Incorporation of non-natural nucleotides into template-switching oligonucleotides reduces background and improves cDNA synthesis from very small RNA samples[J]. BMC genomics, 2010, 11(1): 413.