2021-6-7 UBCG使用

一、软件说明

引用此软件：Na, S. I., Kim, Y. O., Yoon, S. H., Ha, S. M., Baek, I. & Chun, J. (2018). UBCG: Up-to-date bacterial core gene set and pipeline for phylogenomic tree reconstruction. J Microbiol 56. DOI: <10.1007/s12275-018-8014-6

UBCG：最新细菌核心基因集和用于系统树重建的管道
简单来说就是从细菌基因组里提取到92个核心基因经多重比对后串联构建系统发育树。
UBCG管道和文件查看器分别在https://www.ezbiocloud.net/tools/ubcg和https://www.ezbiocloud.net/tools/ubcg_viewer上提供。

二、软件使用

软件要求

Java Runtime Environment Version 8
Prodigal 2.6.3
Hmmsearch 3.1b2
Mafft 7.310 64bit
Fasttree v.2.1.10

java8及UBCG安装包（jre-8u251-linux-x64.tar.gz和UBCG_v3.zip）
链接：https://pan.baidu.com/s/1V9woLFRnS9ebb40OqAvxNw
提取码：pmtf

安装java8参考ubuntu配置jre８

# 解压安装包：

$ tar xvf jre-8u251-linux-x64.tar.gz 

# 移动解压包到/usr/lib/java:
# 注意：执行前确认该目录下有java文件夹，如果没有请先创建

$ sudo  mkdir /usr/lib/java
$ sudo mv -f jre1.8.0_251/ /usr/lib/java

#配置环境变量：
$ sudo vi /etc/environment

在环境变量中添加：
/usr/lib/java/jre1.8.0_251/

保存命令
按ESC键跳到命令模式，然后输入:wq!
强制保存文件，并退出vi

# 安装jre8
$ sudo update-alternatives --install /usr/bin/java java /usr/lib/java/jre1.8.0_251/bin/java 300

# 设置默认的java:
$ sudo update-alternatives --config java

# 测试是否安装成功：
$ java -version

执行结果：

image.png

# 其他软件用conda进行安装。
$ conda create -n UBCG python=3
$ conda activate UBCG
$ conda install -c bioconda prodigal  hmmer mafft fasttree

# 解压UBCG_v3.zip
$ unzip UBCG_v3.zip
$  cd UBCG

找到相应软件工具位置信息添加到programPath文件中

prodigal=/home/ykd/miniconda3/envs/UBCG/bin/prodigal
hmmsearch=/home/ykd/miniconda3/envs/UBCG/bin/hmmsearch
mafft=/home/ykd/miniconda3/envs/UBCG/bin/mafft
fasttree=/home/ykd/miniconda3/envs/UBCG/bin/FastTree
raxml=/home/ykd/miniconda3/envs/UBCG/bin/raxmlHPC-PTHREADS

至此软件安装成功!

软件使用参考[UBCG] User’s Manual

运行 UBCG 管道

步骤 1：将基因组组装或重叠群 (fasta) 转换为 bcg 文件
# java -jar UBCG.jar extract  此命令使用 prodigal 和 hmmsearch 工具将 fasta 文件转换为 bcg 文件。 java -jar UBCG.jar extract  此命令使用 prodigal 和 hmmsearch 工具将 fasta 文件转换为 bcg 文件。
$ java -jar UBCG.jar extract -bcg_dir bcg -i fasta/CP012646_s_GCA_001281025.1_KCOM_1350.fasta -label "CP012646_s KCOM 1350" -acc "GCA_001281025.1" -taxon "CP012646_s" -strain "KCOM 1350" 
$ java -jar UBCG.jar extract -bcg_dir bcg -i fasta/Streptococcus_constellatus_subsp._constellatus_GCA_000474075.1_SK53_TYPE.fasta -label "Streptococcus constellatus subsp. constellatus SK53(T)" -acc "GCA_000474075.1" -taxon "Streptococcus constellatus subsp. constellatus" -strain "SK53" -type 
$ java -jar UBCG.jar extract -bcg_dir bcg -i fasta/Streptococcus_constellatus_subsp._pharyngis_GCA_000223295.2_SK1060_TYPE.fasta -label "Streptococcus constellatus subsp. pharyngis SK1060(T)" -acc "GCA_000223295.2" -taxon "Streptococcus constellatus subsp. pharyngis" -strain "SK1060" -type 
$ java -jar UBCG.jar extract -bcg_dir bcg -i fasta/CP014326_s_GCA_001560895.1_SVGS_061.fasta -label "CP014326_s SVGS_061" -acc "GCA_001560895.1" -taxon "CP014326_s" -strain "SVGS_061" 
$ java -jar UBCG.jar extract -bcg_dir bcg -i fasta/Streptococcus_mitis_GCA_002014755.1_CCUG_31611_TYPE.fasta -label "Streptococcus mitis CCUG 31611(T)" -acc "GCA_002014755.1" -taxon "Streptococcus mitis" -strain "CCUG 31611" -type 
$ java -jar UBCG.jar extract -bcg_dir bcg -i fasta/Streptococcus_pneumoniae_GCA_001457635.1_NCTC_7465_TYPE.fasta -label "Streptococcus pneumoniae NCTC 7465(T)" -acc "GCA_001457635.1" -taxon "Streptococcus pneumoniae" -strain "NCTC 7465" -type 
$ java -jar UBCG.jar extract -bcg_dir bcg -i fasta/Streptococcus_pseudopneumoniae_GCA_002087075.1_CCUG_49455_TYPE.fasta -label "Streptococcus pseudopneumoniae CCUG 49455(T)" -acc "GCA_002087075.1" -taxon "Streptococcus pseudopneumoniae" -strain "CCUG 49455" -type 
$ java -jar UBCG.jar extract -bcg_dir bcg -i fasta/Streptococcus_pneumoniae_GCA_000006885.1_TIGR4.fasta -label "Streptococcus pneumoniae TIGR4" -acc "GCA_000006885.1" -taxon "Streptococcus pneumoniae" -strain "TIGR4" 

步骤 2：从bcg文件生成多个比对，创建UBCG树
# java -jar UBCG.jar align
$ java -jar UBCG.jar align -bcg_dir bcg -prefix my_example

image.png

步骤一必须需要指定以下参数：
-i ：包含基因组组装的输入 FASTA 文件的路径。
-bcg_dir : 所有 bcg 文件的目录。bcg文件的名称将与fasta文件相同。如 -bcg_dir bcg
-label ：菌株/基因组的完整标签。应该用引号包围，如 -label “Escherichia coli O157 876”。 最后进化树上显示的结果
以下是可选参数
-taxon：物种名，如 -taxon “Escherichia coli”
-strain : 菌株名称，如 -strain “O157 876”
-type ：如果菌株是物种或亚种的模式菌株则添加此项
-acc : 基因组序列登录号。

第 2 步必须指定参数：
-bcg_dir 目录，用于要包含在对齐中的 bcg 文件。
可选参数：
-out_dir 所有输出文件所在的目录
-a ：比对方法（默认：codon）。
nt : 核苷酸序列比对
aa : 氨基酸序列比对
codon：基于密码子的比对（输出是核苷酸序列，但比对是使用氨基酸序列进行的）。
codon12 ：与“codon”选项相同，但仅选择密码子的第 1 个和第 2 个核苷酸。第 3 位通常具有高度可变性。
-t <整数> ：要使用的线程数（默认值：1）
-f <整数> ：为包含间隙的位置设置过滤截止值（默认值：50），输入 0~100
0 选择所有对齐位置
100 选择存在于所有基因组中的位置
50 选择存在于一半基因组中的位置
-gsi_threshold：基因支持指数 (GSI) 的阈值。95 表示 95%。（默认值 = 95）
-raxml ：使用 RAxML 进行系统发育重建（默认值：FastTree）。RAxML 比 FastTree 慢得多。
-zZ ：制作 zZ 格式的文件。这还为每个基因组的名称创建了具有 zZ+uid+zZ 格式的 fasta/nwk 文件
典型运行示例
$ java -jar UBCG.jar align -bcg_dir bcg -prefix mytest1
使用“bcg”目录中的bcg文件对齐并绘制树，并将所有结果保存在“output/mytest1”目录中。

mytest1.UBCG_gsi(92).codon.50.label.nwk= A newick file based on UBCG + Gene Support Index (GGI) values with full label

可以用MEGA或其他进化树树查看程序打开。

image.png

UBCG 树显示：
1）92个UBCG都支持两个Streptococcus constellatus亚种间亲缘关系密切。
肺炎链球菌TIGR4与肺炎链球菌；
2）UBCG中有72个基因支持Streptococcus pneumoniae TIGR4与Streptococcus pneumoniae 的模式菌株NCTC 7465密切相关；
3）两个暂定的新种CP012646_s和CP014326_s与S. pneumoniae,Streptococcus pseudopneumoniae和Streptococcus mitis形成了一个单系分枝。

最后编辑于：2021.06.08 10:31:38

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,525评论 6赞 507
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,203评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,862评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,728评论 1赞 294
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,743评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,590评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,330评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,244评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,693评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,885评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,001评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,723评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,343评论 3赞 330
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,919评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,042评论 1赞 270
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,191评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,955评论 2赞 355

2021-6-7 UBCG使用

一、软件说明

二、软件使用

软件要求

推荐阅读更多精彩内容