Gepard Linux Command line mode

  Gepard软件能快速对两个fasta格式的序列进行共线性分析,获得二维点图。我利用该软件判断由GetOrganelle组装获得的叶绿体ssc区的方向。尽管这是2007年就发布的软件[1],但应付上述目的绰绰有余。

图1 Gepard在windows中的可视化软件界面,这里是对Cas_hy, cas004-2两个叶绿体基因组文件进行分析

  之前已经尝试过windows的版本(参考[3]),但当有大量组装完成的叶绿体ssc需要判断时,就有必要批处理了。Gepard的linux安装利用conda或Docker,相当便捷,参考https://github.com/univieCUBE/gepard

  安装后键入Gepardcmd弹出help信息

Gepard 2.0 - command line mode

Reference:
Krumsiek J, Arnold R, Rattei T
Gepard: A rapid and sensitive tool for creating dotplots on genome scale.
Bioinformatics 2007; 23(8): 1026-8. PMID: 17309896

Parameters are supplied as -name value

Required parameters:
  -seq:        the sequences, seperated by spaces. The first gets paired to the second, third to fourth and so on.
  -matrix:      substitution matrix file
  -outfile:     output file name

... (Following omission)

  -seq, -matrix, -outfile是必需的,-seq, -outfile很好理解,与windows界面不同的是需要键入-matrix,这是要求输入一个核苷酸替代矩阵,官方tutorial推荐matrices/edna.mat。conda安装的通过以下命令找到这个替代矩阵:

$ which gepard
~/miniconda3/envs/gepard/bin/gepard
$ cd ~/miniconda3/envs/gepard
$ find -name edna.mat
./share/gepard/resources/matrices/edna.mat
./share/gepard/src/matrices/edna.mat
$ cd ./share/gepard/resources/matrices
$ less edna.mat
#
# This matrix was created by Todd Lowe 12/10/92
#
# Uses ambiguous nucleotide codes, probabilities rounded to
# nearest integer
#
# Lowest score = -4, Highest score = 5
#
# modified for use with gepard (delimiter letter Z)

   A  T  G  C  N  W  R  Y  K  M  B  V  H  D  S  U  Z  X 
A  1  0  0  0 -2 -4  1  1 -4 -4  1 -4 -1 -1 -1 -4 -9 -9
T  0  1  0  0 -2 -4  1 -4  1  1 -4 -1 -4 -1 -1  5 -9 -9
G  0  0  1  0 -2  1 -4  1 -4  1 -4 -1 -1 -4 -1 -4 -9 -9
C  0  0  0  1 -2  1 -4 -4  1 -4  1 -1 -1 -1 -4 -4 -9 -9
N -2 -2 -2 -2 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -2 -9 -9
W -4 -4  1  1 -1 -1 -4 -2 -2 -2 -2 -1 -1 -3 -3 -4 -9 -9
R  1  1 -4 -4 -1 -4 -1 -2 -2 -2 -2 -3 -3 -1 -1  1 -9 -9
Y  1 -4  1 -4 -1 -2 -2 -1 -4 -2 -2 -3 -1 -3 -1 -4 -9 -9
K -4  1 -4  1 -1 -2 -2 -4 -1 -2 -2 -1 -3 -1 -3 -1 -9 -9
M -4  1  1 -4 -1 -2 -2 -2 -2 -1 -4 -1 -3 -3 -1  1 -9 -9
B  1 -4 -4  1 -1 -2 -2 -2 -2 -4 -1 -3 -1 -1 -3 -4 -9 -9
V -4 -1 -1 -1 -1 -1 -3 -3 -1 -1 -3 -1 -2 -2 -2 -1 -9 -9
H -1 -4 -1 -1 -1 -1 -3 -1 -3 -3 -1 -2 -1 -2 -2 -4 -9 -9
D -1 -1 -4 -1 -1 -3 -1 -3 -1 -3 -1 -2 -2 -1 -2 -1 -9 -9
S -1 -1 -1 -4 -1 -3 -1 -1 -3 -1 -3 -2 -2 -2 -1 -1 -9 -9
U -4  5 -4 -4 -2 -4  1 -4  1  1 -4 -1 -4 -1 -1  5 -9 -9
Z -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9
X -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9 -9

  知道矩阵存放位置后,还需找到软件存放地址(因为我试验环境变量的命令直接调用跑不通,不清楚是为什么),实际上就是.../share/geparddist,里面有Gepard-1.40.jar Gepard-2.1.jar两个文件,使用Gepard-2.1.jar(两个程序都可用,但命令略有不同,以后者为例)。

  然后就可以运行软件了。由于官方tutorial文件没有及时更新,实际的运行命令应该是(对应Gepard-2.1版本,即现在下载默认的版本)[2]

java -cp ~/miniconda3/envs/gepard/share/gepard/dist/Gepard-2.1.jar org.gepard.client.cmdline.CommandLine \
-seq ref.fasta test.fasta \
-matrix ~/miniconda3/envs/gepard/share/gepard/resources/matrices/edna.mat \
-outfile test1.png

  运行会报错并弹出一个窗口,需要安装xmanager 11什么的,就按指示安装,第一次安装有个30天试用,管他呢,先用了,后面用到再想办法...:

Loading substitution matrix...
Loading sequence from ref.fasta
Loading sequence from test.fasta
Calculating suffix array... 
Calculating dotplot... 
Creating image and writing to file... 
Exception in thread "main" java.awt.AWTError: Can't connect to X11 window server using 'localhost:12.0' as the value of the DISPLAY variable.
    at java.desktop/sun.awt.X11GraphicsEnvironment.initDisplay(Native Method)
    at java.desktop/sun.awt.X11GraphicsEnvironment$1.run(X11GraphicsEnvironment.java:104)
    at java.base/java.security.AccessController.doPrivileged(Native Method)
    at java.desktop/sun.awt.X11GraphicsEnvironment.<clinit>(X11GraphicsEnvironment.java:63)
    at java.base/java.lang.Class.forName0(Native Method)
    at java.base/java.lang.Class.forName(Class.java:315)
    at java.desktop/java.awt.GraphicsEnvironment$LocalGE.createGE(GraphicsEnvironment.java:101)
    at java.desktop/java.awt.GraphicsEnvironment$LocalGE.<clinit>(GraphicsEnvironment.java:83)
    at java.desktop/java.awt.GraphicsEnvironment.getLocalGraphicsEnvironment(GraphicsEnvironment.java:129)
    at java.desktop/java.awt.image.BufferedImage.createGraphics(BufferedImage.java:1181)
    at java.desktop/java.awt.image.BufferedImage.getGraphics(BufferedImage.java:1170)
    at org.gepard.client.Plotter.<init>(Plotter.java:92)
    at org.gepard.client.cmdline.CommandLine.main(CommandLine.java:304)

  安装完再运行,就正常,

Loading substitution matrix...
Loading sequence from ref.fasta
Loading sequence from test.fasta
Calculating suffix array... 
Calculating dotplot... 
Creating image and writing to file...

  最后写个循环就实现批处理啦!


参考资料:
[1] Krumsiek J, Arnold R, Rattei T. Gepard: a rapid and sensitive tool for creating dotplots on genome scale[J]. Bioinformatics, 2007, 23(8): 1026-1028.
[2] How to start gepard on the commandline.
[3] 被子植物·叶绿体组装、注释与比较分析·框架

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,816评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,729评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,300评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,780评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,890评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,084评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,151评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,912评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,355评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,666评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,809评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,504评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,150评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,121评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,628评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,724评论 2 351

推荐阅读更多精彩内容