“简化基因组”这个词最早来源于简化基因组测序(reduced representation genome sequencing),而简化基因组测序是一个笼统的概念,属于一类测序方法的合称。简化基因组测序的最初目的是为了发现SNP位点以及基因组作图等。
实际上在历史上出现数个目前看来是属于“简化基因组”的测序方法之前,所发明的方法都是以其各自的特色命名,直到有多种类似方法诞生后,人们才从中总结出一些共性,把它们统一称作“简化基因组测序法”。这共性便是:所有这类方法所获得的文库都不是全基因组文库,但基于研究目的所需,认为所获得的文库足以代表整个基因组,涵盖了尽可能多的全基因组信息,且新文库在全基因组范围内分布较均匀。
常用于动物基因组研究的简化基因组测序技术主要有简化代表文库测序(reduced-representation libraries sequencing,RRLs)和限制性酶切位点关联 DNA 测序(restriction-site-associated DNA sequencing,RAD-seq),而后者在植物基因组与进化研究中也颇为频繁[1]。下面简单介绍这两种方法的原理。
简化代表文库的使用于人类基因组研究中首次提出(图1)。通过选择一种内切酶进行酶切,然后进行文库片段大小的选择,使用一定大小的酶切片段所对应的序列作为整个基因组序列的部分代表,来降低基因组的复杂性。对群体中不同基因型的个体采用相同的内切酶进行酶切,回收相同大小范围的酶切片段,建立文库,然后进行高通量测序[2]。
限制性酶切位点关联 DNA 测序(RAD-seq)文库是RAD标签的集合(图2)。获得过程简单来说是对酶切后DNA片段加上可与酶切所得黏性末端序列互补的接头1,随机打断后,再加上非特异性接头2,利用识别接头1和接头2上的引物对进行PCR反应,只有分别带有接头1和接头2的酶切位点周边的DNA片段会得到有意义的扩增,即为RAD标签[2]。
对比上述两种方法,区别在于酶切后的片段选择。RRLs是对一定长度的片段进行选择;RAD-seq则是选择出添加有两段接头的片段,这将包括长短不一的DNA分子。因此若反应控制得当,RAD-seq将保留更多基因组信息。
简化基因组的优势。简化基因组之所以简化,就是因其对复杂的基因组进行筛选,得到了涵盖较多信息的文库,并基于此分析。因此简化基因组大幅降低测序成本,于是针对简化基因组文库,可适当增加测序深度,有利于微小突变的挖掘;此外,数据量小了,方便分析。也因是简化了的基因组,其存在以下缺陷:可能遗失某些关键的遗传信息,在某些领域并不适用。
参考文献
[1] 李国治,邓卫东.基因组测序技术及其应用研究进展[J].安徽农业科学,2018,46(22):20-22.
[2] 岳桂东,高强,罗龙海,等.高通量测序技术在动植物研究领域中的应用[J].中国科学:生命科学,2012,42(02):107-124.
推荐博文
简化基因组的测序方法. xuzhougeng - 简书.