NGS - Next Generation Sequencing, 以后可以用于个性化治疗,基因疾病和临床诊断。
三种测序方法:https://www.zhihu.com/question/31549894
一代测序(Sanger Sequencing)
1976, 准确率高,被称为基因检测的金标准。仍用于实际测序或用于验证NGS结果。
Sanger法测序是利用一种DNA聚合酶来延伸结合在待定序列模板上的引物,直到掺入一种链终止核苷酸为止。每一次序列测定由一套4个单独的反应构成,每个反应含有所有4种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需的3-OH基团,使延长的寡聚核苷酸选择性的在A,T,C,G处终止并在每个碱基后面进行荧光标记,产生以A,T,C,G结束的四组不同长度的一系列核苷酸,然后再尿素变性的PAGE胶上电泳进行检测,从而获得可见的DNA碱基序列。
https://zhuanlan.zhihu.com/p/29270914
http://www.360doc.com/content/17/1101/00/33459258_699876240.shtml
https://www.nature.com/articles/nature24286
https://www.youtube.com/watch?v=jFCD8Q6qSTM
步骤:
- 得到DNA链段,加热使DNA变性,双链解成单链,并用其中一条作模板链。(如何获得纯净的单边链?)
- fragmented DNA - 模板链打散成随机小片段(500bp左右)。
- 模板链溶液中,加入引物(primer),与模板链的3’位置结合(加引物是因为DNA聚合酶不能重头复制,需要前面有一小段起点)。
- 加入DNA聚合酶,及正常DNA合成需要的4种正常碱基(dNTP),A(腺嘌呤), T(胸腺嘧啶), C(胞嘧啶), G(鸟嘌呤)及掺入少量的标记有不同荧光的能够终止延长反应的特殊碱基(ddNTP)。A,T,G,C,再进行PCR(Polymerase Chain Reaction,聚合酶链式反应)。该特殊碱基一旦结合到链上便能终止DNA延长,从而得到延长程度不同的带有不同末端的DNA链
- 将复制的DNA链通过毛细管电泳实现质量/大小排序。(如何去重?)
- 排序后的DNA链通过激光器激发ddNTP荧光分析得到对应的序列。
1979 Staden 鸟枪法测序(shotgun)
https://wenku.baidu.com/view/aa8e2cd6770bf78a652954d2.html?rec_flag=default&sxts=1535423640166
可能问题:
- 拼接错误
- 分段不合适
- 重复序列的存在
- 字符串比对- 两个字符串的距离
二代测序(大规模并行DNA测序技术)
NGS在人类基因组计划完成的10年内高速发展,几乎替代了Sanger测序。
NGS技术在一些方法上与电泳测序明显不同:
- 主要的变化是多路技术。不是每个反应一管,而是将一个复杂的DNA模板库固定到一个双向表面上,所有的模板都可以与单个实际进行反应。
- 该技术更不是细菌克隆,而是在体外产生大量的测序模板。
- 最后,也不是测量片段的长度,而是测定生物化学循环(如聚合酶接到的荧光标记核苷酸)和成像(也被称为边合成边测序,Sequencing By Synthesis)。
常用仪器
Illumina新推出了2017 NovaSeq-生产级;2018 iSeq-小型实验室。
- Illumina Miseq (实现重点的应用,如靶向重测序、元基因组、小型基因组测序、靶向基因表达分析等,微生物测序)
- Illumina HiSeq 高通量
- Roche 454 Sequencer
- ABI SOLiD system
- Life Tech Ion Proton
2010年NGS市场:Illumina占69%,Life Tech占16%,Roche占15%。
http://www.ebiotrade.com/newsf/2015-11/2015111991347488.htm
历史仪器:
第一个综合的NGS平台来自于2005年,即Solexa。
在2005年,454发布了第一个商业化的NGS仪器。
与人类基因组计划期间美国应用生物系统公司(ABI)的垄断不同,一些公司包括454(被罗氏收购)、Solexa(被Illumina收购)、Agencourt(被美国应用生物系统公司ABI收购,SOLiD)、Helicos(由Quake成立)、Complete Genomics(由Drmanac成立)和Ion Torrent(由Rothberg成立,后被Life Technology在2010收购)在激烈地竞争NGS,通过不断出现的新仪器迅速改变了以上的垄断情况,他们每年都会在硅谷的AGBT会议(Advances in Genome Biology & Technology,基因组技术和生物进展)上发布新的仪器。在2007到2012年间,DNA测序的每个碱基的耗费下降了4个数量级。
Sequencing By Synthesis步骤
https://www.illumina.com/science/technology/next-generation-sequencing.html
http://www.funinusa.net/article-182005-1.html(中文)
Sample Preparation https://zhuanlan.zhihu.com/p/35278810
建库,在DNA片段两端加上序列已知的通用接头构建文库,文库加载到测序芯片Flowcell
Add adaptors ->DNA fragments,包括sequencing binding site(Read1和Read2的测序引物结合区), indice (用于区分不同样本), binding site to flowcell oligos(接头:与flow cell结合区)等-
Cluster Generation
簇生成。文库两端的已知序列与Flowcell基底上的Oligo序列互补,每条文库片段都经过桥式PCR扩增形成一个簇
bridge amplification
Cluster Generation.png -
Sequencing
簇扩增及测序。与步骤二同时进行。即在碱基延伸过程中,每个循环反应只能延伸一个正确互补的碱基,根据四种不同的荧光信号确认碱基种类,保证最终的核酸序列质量,经过多个循环后,完整读取核酸序列。
Sequencing.png -
Data Analysis
Data Analysis.png
三代测序(实时单分子测序,目前错误率较高,不适用临床):
- Single Molecule, Real-Time (SMRT)
Pacific Biosciences (PacBio) de novo组装
Sequel System, SMRT technique
在实时测序中通过光学观察聚合酶的合成。.
https://www.pacb.com/smrt-science/smrt-sequencing/
SMRT Techniques.png
- Nanopore
Oxford Nanopore (Oxford Nanopore Technologies, ONT) 便携,准确率太低
https://nanoporetech.com/applications/dna-nanopore-sequencing
Nanopore Sequencing.png
Genia(George Church大神力荐,已被Roche$125MM重金收购,希望不要被毁掉)
Illumina未公布
用途
De novo genome assembly 从头基因组测序
Genome resequencing
通过对比参照基因组来检测突变和种群差异。
Bowtie and Burrows–Wheeler Aligner (BWA) enable millions of reads to be efficiently mapped to the reference genome。
Popular packages, initially SAMtools and later GATK, adapted the confidence framework of phred to NGS bases, reads and variants
- Clinical applications of sequencing
- NIPT(无创产前筛查,Non-Invasive Prenatal Testing)
- WES(whole exome sequencing,全外显子测序)用于检测胎儿孟德尔病及神经发育障碍。
- 癌症诊断
- Sequencers as a molecule counting device
hundreds of protocols were developed that facilitate the use of DNA sequencing as a ‘molecule counter’ for the characterization of a remarkable range of biochemical or molecular phenomena, including transcription, translation, DNA replication, the secondary structure of RNA, chromosome conformation, nucleic-acid modifications, post-translational modifications, nucleic acid–protein interactions and protein–protein interactions.
用于表征各种生物化学或分子现象,包括转录,翻译,DNA复制,RNA的二级结构,染色体构象,核酸酸修饰,翻译后修饰,核酸 - 蛋白质相互作用和蛋白质 - 蛋白质相互作用。
- Metagenome sequencing
微生物环境基因组学。从环境样品中提取全部微生物的DNA,构建宏基因组文库,利用基因组学的研究策略研究环境样品所包含的全部微生物的遗传组成及其群落功能。获得该环境中微生物的遗传多样性和分子生态学信息.
未来
Genome diversity:多物种,多物质(蛋白质等)
Population-scale resequencing:对比得到基因突变数据
Developmental biology:ex vivo -> In situ -> in vivo genome editing
Real-time, portable sensors:ONT重70g,U盘大小。
Unconventional uses: nanopore可能用于监测蛋白折叠,化学纳米机器等