初识下一代测序技术

下一代测序技术(Next-Generation Sequencing, NGS)是近十年来生命科学领域迅猛发展的分支之一,它包括但不限于以下技术:
  • 全基因组测序(Whole Genome Sequencing, WGS)用于揭示生物体完整的DNA组成,使我们能够更好地了解物种内部和物种之间的差异,这反过来又使我们能够以其他技术所不允许的精密度来区分生物体。

  • 基于酶切的简化基因组测序(Restriction-site Associated DNA Sequence, RAD-Seq)是对与限制性核酸内切酶识别位点相关的 DNA 进行高通量测序,可快速鉴定出高密度的SNP位点,实现遗传进化分析及重要性状候选基因的预测。

  • 转录组测序技术(RNA-Seq),就是把 mRNA,smallRNA 和 non-coding RNA 等或者其中一些用高通量测序技术把它们的序列测出来,反映出它们的表达水平。

  • 染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP)是研究体内蛋白质与 DNA 相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。首先通过染色质免疫共沉淀技术(ChIP)特异性地富集目的蛋白结合的 DNA 片段,并对其进行纯化与文库构建;然后对富集得到的DNA片段进行高通量测序。

这些技术也被称为高通量测序技术因为他们可以产生大量数据,也使得生物信息学进入了大数据时代。在这其中,以下格式的文件常被用到:

  • FASTA 格式:一种基于文本用于表示核酸序列或多肽序列的格式。其中核酸或氨基酸均以单个字母来表示,且允许在序列前添加序列名及注释。该格式已成为生物信息学领域的一项标准。其第一行是由大于号“>”(较常用)或分号“;”打头的任意文字说明,用于序列标记。从第二行开始为序列本身,只允许使用既定的核苷酸或氨基酸编码符号(参见支持代码类型)。通常核苷酸符号大小写均可,而氨基酸常用大写字母。使用时应注意有些程序对大小写有明确要求。一般每行60~80个字母。
>gi|187608668|ref|NM_001043364.2|Bombyx mori moricin (Mor), mRNA
AAACCCTTACTGGGCTGATCGCGCGTCGGGATCGGCTAGCTAGCTAGCGCTCTAGCTAGCTAGCTAGCTA
GCTAGCTAGCTAGCACACACACACACACACACGTGTAGTCATAACGTACGTACGTAACACGTACACTGTA
  • FASTQ 格式:是序列格式中常见的一种,FASTQ格式的序列一般都包含有四行,第一行由'@'开始,后面跟着序列的描述信息,这点跟FASTA格式是一样的。第二行是序列。第三行由'+'开始,后面也可以跟着序列的描述信息。第四行是第二行序列测序的质量评价,字符数跟第二行的序列是相等的。
@EAS54_6_R1_2_1_413_324
CCCGGTCGTAGTTTCGATGGCTAG
+
;;3;;;;;;;;;;;8;;;;7;;8
  • SAM/BAM 格式:SAM 格式为纯文本格式,字里行间压缩了极大的信息。BAM 格式则是SAM 格式的二进制版,在SAM 格式的基础上运用二进制编码,又极大的压缩了SAM 格式的体积。

@HD VN:1.6 SO:coordinate
@SQ SN:ref LN:45
r001 99 ref 7 30 8M2I4M1D3M = 37 39 TTAGATAAAGGATACTG *
r002 0 ref 9 30 3S6M1P1I4M * 0 0 AAAAGATAAGGATA *
r003 0 ref 9 30 5S6M * 0 0 GCCTAAGCTAA * SA:Z:ref,29,-,6H5M,17,0;
r004 0 ref 16 30 6M14N5M * 0 0 ATAGCTTCAGC *
r003 2064 ref 29 17 6H5M * 0 0 TAGGC * SA:Z:ref,9,+,5S6M,30,1;
r001 147 ref 37 30 9M = 7 -39 CAGCGGCAT * NM:i:1

  • VCF 格式:是存储变异位点的标准格式,可以用来表示单核苷酸多态性(SNP)、插入缺失、结构变异 、拷贝数量变异。VCF使用UTF-8编码,有两大部分:一部分是注释信息(以##开头),一部分是具体突变信息。
##fileformat=VCFv4.2
##fileData=20190709
##source=myData
##reference=file:///seq/reference/gennomeproject/Iamhappy.fasta
##contig=<ID=20, length=52000000, assmbly=B31, md5=sqs5qjfieije8sjqksq987, species="Homo sapiens", taxonomy=x>
##phasing=partial
##INFO=<ID=NS, Number=1, Type=Integer, Description="Number of Samples With Data">
##INFO=<ID=DP, Number=1, Type=Integer, Description="Total Depth">
##INFO=<ID=AF, Number=A, Type=Float, Description="Allele Frequency">
##FILTER=<ID=q10, Description="Quality below 10">
##FORMAT=<ID=GT, Number=1, Type=String, Description="Genotype">
##FORMAT=<ID=GQ, Number=1, Type=Integer, Description="Genotype Quality">
##FORMAT=<ID=DP, Number=1, Type=Integer, Description="Read Depth">
##FORMAT=<ID=HQ, Number=2, Type=Integer, Description="Haplotype Quality">
#CHROM  POS  ID  REF  ALT  QUAL  FILTER  INFO  FORMAT  NA0001
20 14307  rs1234567  G  A  28  PASS  NS=3;DP=14;AF=0.5;DB;H2  GP:GQ:DP:HQ  0|0:48:1:51,51

在下一章中我们将进入实例。

小结

在这一章中我们学习了:

  • 下一代测序技术的主要技术分支
  • 下一代测序技术的主要文件格式
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,755评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,369评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,799评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,910评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,096评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,159评论 3 411
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,917评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,360评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,673评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,814评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,509评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,156评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,123评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,641评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,728评论 2 351

推荐阅读更多精彩内容