以小编自己最近在做的HBV mapping为例,前期的环境部署及软件安装找时间再细说,直接进入主题,如下:
前期准备:
Linux以及Windows操作系统,HISAT2、Samtools以及IGV等软件的安装,fastq文件
操作步骤:
1. 在NCBI中找到HBV genotypeD的序列并下载sequence.gb以及sequence.fa格式文件。
2. 使用HISAT2构建HBV genome的Index,命名为HBVgenotypeD。
extract_exons.py sequence.gb > exons.txt
extract_splice_sites.py sequence.gb > splicesites.txt
hisat2-build --s splicesites.txt --exon exons.txt PATH/sequence.fa HBVgenotypeD
3. 采用HISAT2进行mapping获得sam文件,命名为HBVmaping.sam。
hisat2 -p 8 --dta -x PATH/ HBVgenotypeD -1 HBV_R1.fastq.gz -2 HBV_R2.fastq.gz -S HBVmaping.sam
5. 采用Samtools将sam文件sort为bam文件,命名为HBVmaping.bam。
samtools sort -@ 8 -o HBVmaping.bam HBVmaping.sam
6. 对bam文件建立index。
samtools index HBVmaping.bam
7. 打开IGV,genome——load genome from file,选择sequence.fa;File——load from file,选择HBVmaping.bam。结果如下:
大功告成!
怎么样,是不是很简单呢?快来试一试吧!