1 下载
注册即可下载 http://www.openbioinformatics.org/annovar/annovar_download_form.php
2文件准备
- ref.fa
- ref.gtf 或者gff3
- .vcf文件
3 gff文件转换
用gff3ToGenePred与gtfToGenePred工具将gtf或gff3文件转化为reference_refGene.txt
gff3ToGenePred.dms gff3 SP_refGene.txt
4 ref.fa 格式转换
perl retrieve_seq_from_fasta.pl --format refGene --seqfile ref.fa SP_refGene.txt
5 vcf格式转换
perl convert2annovar.pl -includeinfo -allsample -withfreq \
-format vcf4 sample.VCF >sample.avinput
# --includeinfo: 输出文件含有特定额外的信息
# --allsample: 多样本的vcf,输出多个样本的结果
# --withfreq: 输出文件包含频率信息
# --format: 输入文件格式
6 注释
用table_annovar.pl进行注释(可一次性完成三种类型的注释, 本次只有基于基因)
perl ../table_annovar.pl test.avinput sp/ --buildver SP --outfile myanno --protocol refGene --operation g
##参数
sp: 含有SP_refGeneMrna.fa和SP_refGene.txt文件夹
--buildver: 基因组建立的版本
--outfile: 输出文件前缀
--protocol: 逗号分隔的注释流程,代表库的名字
--operation: g(gene),r(region),f(filter)
最终得到两个注释文件文件和一个log文件exonic_variant_function和variant_function