很多在线的gRNA脱靶检测软件,仅限选定的物种,所以对非模式物种来说并不友好。本文选取两个相对简单的脱靶检测软件,CHOPCHOP和CasOT进行脱靶位点的检测。前提是物种需要有公布的基因组序列或注释信息。
-
CHOPCHOP
首先在官网界面,输入基因名字或Fasta序列,选择相应的物种,然后点击运行即可搜寻候选的sgRNA。在结果文件页面,包含了10个候选的sgRNA,单击sgRNA进入单独界面,会详细罗列出在全基因组范围内潜在的脱靶位点。
找寻脱靶位点基因组序列:
首先在NCBI上输入脱靶定位的序列,如NW_011876316,
在基因组中肉眼很难观测到,可以下载下来全序列然后MEGA寻找,当然这些都是最传统的办法,比较便捷的是可以通过NCBI提供的Genome Data Viewer直接查找而无需下载。在页面右侧单击Show in Genome Data Viewer(新建页面,保留原始页面)
然后选择Tools > Search,输入脱靶的核酸序列,然后找到具体对应基因组的位置,如下图所示:
本处比对到NW_011876316的945659——945681,然后回到NCBI比对的界面,在右侧的Change region shown,输入选择的区域,这里在我输入的序列在脱靶序列上下游个1000bp,便于后面进行基因扩增检测。
然后下载下来即可。
-
CasOT
CasOT支持本地windows操作,且没有物种限制。软件是用Perl脚本,所以首先安装Perl,然后就是windows命令行本地化运行:
win+R
cmd
# 进入软件所在目录位置
cd G:\01_J.F.XIE\CasOT-1.0
# 检测软件是否可运行
.\CasOT-1.0\casot.pl -h
# 1st. 启动可执行perl脚本
.\CasOT-1.0\casot.pl
#2sn. 输入关键参数
-t='<target_site_file>' -g='<genome_sequence_file>' -e='<exon_annotation_file>' -o=tab -s=2 -n=4 -p=A
注意输入的路径!!!
当前所在路径和输入文件路径(当前文件夹用:.\)
--- Options ---
-h: show this help
-m=<searching_mode>: single, paired, or target (default: single)
-t=<target_site_file>
-g=<genome_sequence_file>
-e=<exon_annotation_file>
-o=<output_format>: csv or tab (defualt: csv)
-s=<maximum_number_of_mismatches_allowed_in_the_seed_region>: 0-6 (nt) (default: 2; >4 is not suggested)
-n=<maximum_number_of_mismatches_allowed_in_the_non-seed_region>: 0-255 (nt) (default: 255)
-p=<level_of_PAM_type_allowed>: A, B, C or N (default: A)
Level A: NGG
Level B: NGG + NAG
Level C: NGG + NAG + NNGG
Level N: (no limit)
-d=<maximum_distance_of_paired_off-target>: 0-1000 (default: 100)
-r=<require_5'-G_or_not_in_candidate_target>: yes or no (default: yes)
-l=<length_range_allowed_for_candidate_target>: two number between 18 and 30 (default: 19-20)
参数详见文档说明,或-h查看。
运行大约5分钟即可出结果。
结果说明: