Short Read Aligners

1、Short read aligners are designed to find regions of high similarity,当匹配的位置达到设定的阈值范围变不再寻找。

2、mapping 并非最佳匹配,只是为了在基因组中找到一个合适的正确位置,alignment则要求每个碱基的最佳匹配。当检查SNP或者结构差异时更适合使用alignment,而当处理RNA-seq时只需要mapping把reads放到正确的位置。当我们挑选比对工具时,还需考虑

3、BWA

1⃣️bwa有两种算法,aln 和mem 分别处理低于100bp和大于70bp的reads。

2⃣️建立索引,最好将ref genome 单独固定放在一个dir下:bwa index /refs/ebola/1976.fa

3⃣️找到某个项目号下所有sra的信息(ebola):esearch -db sra -query PRJNA257197| efetch -format runinfo > runinfo.csv

4⃣️fast-dump 下载并分离双端sra:fastq-dump -X 10000 --split-files SRR1972739

5⃣️align: bwa mem refs/ebola/1976.fa SRR1972739_1.fastq  SRR1972739_2.fastq > bwa.sam

6⃣️罚分参数:

7⃣️There are other parameters where a single word will set multiple values:note how -x ont2d is equivalent to setting -k14 -W20 -r10 -A1 -B1 -O1 -E1 -L0 . These are the recommended settings when aligning data from an Oxford Nanopore MinION instrument.

4、bowtie

1⃣️建立索引,需要同时指定input output:bowtie2-build in out

2⃣️align:bowtie2  -x refs/ebola/1976.fa -1 SRR1972739_1.fastq -2 SRR1972739_2.fastq >bowtie.sam

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容