在测定基因表达量的过程中,如何设计合理的引物是需要解决的重要问题。当要对大量序列设计引物时(例如,对家族成员进行引物设计或者对转录组进行验证),该过程将变得非常繁琐且耗时。那么该如何进行批量的引物设计呢?在SPDE的genes模块,设计了相应功能完成该过程。
首先,需要将要设计的引物整理成fasta格式,如下所示:
基本格式是大于号,基因ID一行,下一行是序列。考虑到有些同学的fasta文件可能一个基因的序列在不同行上,例如:
这个时候,需要对文件进行一个格式化的处理。该功能安排在:
这里①,仅仅只是将不在同一行的序列归到一行;②,除了将不在同一行的序列归到一行以外,还对基因ID进行处理,处理的结果是把一些额外的、并不需要的信息给它去除掉,如下:
③,将已经准备好的fasta文件转变成需要进行引物设计的格式。所以,如果需要批量引物设计,①和②择其一,③必选。
将文件格式化后,来到genes模块:
其中,①是PCR产物的长度,需要是一个范围(例如150-300)。然后是放入格式化好的fasta文件,设置保存控制文件的路径及名称(为什么要有控制文件,可参见前一章节,GENE模块),设置生成结果的保存路径及名称。这些设置完成后,分别点击右侧面板的①和②,即可完成批量引物设计:
会同时产生两个类型的文件,其一是你所命名的文件,内容如下:
每条序列除最上面的推荐引物外,还为用户提供了另外四对备选引物。其二是只含有推荐引物的文件,该文件的名字含有“-only_primers”字样,内容如下:
当然,一般情况下大家只需要关注只含有推荐引物的这个文件就好。同时,F和R已经为大家标明,如果这个文件每一对引物都是特异的,那么,可以将该结果直接复制到引物合成单中,对引物进行合成。如果,这个文件有些基因的引物与其他基因引物相同(这种情况比较常见于家族分析以及同一基因的不同转录本,因为,会有一些序列很相似的基因存在),那么大家就只能到GENE模块对序列相似的基因进行单独设计了(因为GENE模块中的引物设计可以指定引物产生的区域,也可以考虑利用GENE模块提取UTR区来设计引物)。当然,还有另外一种情况是设计引物的结果没有给出任何引物,这种情况的原因是你所放入的序列都不适合产生合理的引物,这个时候可能要考虑是否更换序列以及其他一些方式。与前一模块引物设计类似,该模块的引物设计功能也已经经过实验验证。
除引物的批量设计外,该模块还安排了其他的批量功能,例如:
①从fasta文件中批量提取基因ID;②根据ID从fasta文件中提取相应序列(注意,一个ID一行);③根据基因ID从gff类文件中提取与其相关的信息;④批量翻译;⑤批量去除终止子。最后的两个功能则是检测所放入的ID是否在fasta文件或者gff类文件中。应用规律是,应保证所输入的fasta文件是如上所述经过格式化的,大家只需要按照功能后的数字,找到相应的框,填入需要的文件即可,比如①功能的后面标注的是1和7,那么需要填入信息的是第一个框和第七个框,所以:
当然,除了这些功能外,还可以将fastq文件转为fasta文件。
总体来说,基本功能就是这样。但,能够将这些功能组合到什么程度,这个以个人的智慧以及对SPDE熟练程度而定位~