一般使用gatk 之后会得到变异的vcf 文件,然后我们要对得到的变异数据进行注释。
官网如下http://snpeff.sourceforge.net/SnpEff_manual.html#databases
1下载
2按照官网的步骤操作
Go to home dir
cd
Download latest version
wget http://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip
Unzip file
unzip snpEff_latest_core.zip
database 基本网上都有的下载
但是。。我的服务器不能联网。。所以我学了自己如何做注释的database
制作database
参考一下几篇文章:
http://blog.csdn.net/msw521sg/article/details/77103620
https://www.cnblogs.com/freemao/p/3975927.html
https://www.plob.org/article/9936.html
下载基因组文件 和注释文件,文件格式不同,采用的方式也不一样
- 进入文件夹:
/public/home/name/tool/snpEff_latest_core/snpEff
哈哈,有一些是我分析生成的结果文件,原谅我没有整理好。。
- 我以MH63.fa 作为参考基因组,注释文件是genes.gff
3.编辑一下snpEFF.config 加入一下文字
- 退出
然后 mkdir data
cd data
创建一个genomes 和MH63的文件夹
5 把注释文件放入 MH63
把基因组文件放入 genomes
6 回到前一个目录 执行
java -jar snpEff.jar build -gff3 -v MH63
7 测试
把BSA.vcf 文件放入 data 里面
回到snpEFF目录
然后执行
java -jar snpEff.jar MH63 data/BSA.vcf > BSA.eff.vcf
8 出现三个文件
snpEff_genes.txt
snpEff_summary.html
BSA.eff.vcf
进一步学习就要进入官网仔细学习了