1、Short read aligners are designed to find regions of high similarity,当匹配的位置达到设定的阈值范围变不再寻找。
2、mapping 并非最佳匹配,只是为了在基因组中找到一个合适的正确位置,alignment则要求每个碱基的最佳匹配。当检查SNP或者结构差异时更适合使用alignment,而当处理RNA-seq时只需要mapping把reads放到正确的位置。当我们挑选比对工具时,还需考虑
3、BWA
1⃣️bwa有两种算法,aln 和mem 分别处理低于100bp和大于70bp的reads。
2⃣️建立索引,最好将ref genome 单独固定放在一个dir下:bwa index /refs/ebola/1976.fa
3⃣️找到某个项目号下所有sra的信息(ebola):esearch -db sra -query PRJNA257197| efetch -format runinfo > runinfo.csv
4⃣️fast-dump 下载并分离双端sra:fastq-dump -X 10000 --split-files SRR1972739
5⃣️align: bwa mem refs/ebola/1976.fa SRR1972739_1.fastq SRR1972739_2.fastq > bwa.sam
6⃣️罚分参数:
7⃣️There are other parameters where a single word will set multiple values:note how -x ont2d is equivalent to setting -k14 -W20 -r10 -A1 -B1 -O1 -E1 -L0 . These are the recommended settings when aligning data from an Oxford Nanopore MinION instrument.
4、bowtie
1⃣️建立索引,需要同时指定input output:bowtie2-build in out
2⃣️align:bowtie2 -x refs/ebola/1976.fa -1 SRR1972739_1.fastq -2 SRR1972739_2.fastq >bowtie.sam