宏基因组测序分析(十)功能注释

eggnog注释

使用在线版 eggnog-mapper 进行 eggnog 数据库注释。

eggnong数据库全称为evolutionary genealogy of genes: Non-supervised Orthologous Groups,是对NCBI的COG数据库的拓展,提供不同分类水平蛋白的直系同源组(Orthologous Groups,OG)。它扩展了COG数据库的分类方法,并且提供进行eggnog注释的工具:eggNOG-mapper


在线版 eggnog-mapper 单次输入序列条数不能超 10 万条,可以对氨基酸序列进行切分。

 seqkit split --by-size 100000 --out-dir split unigene_pep.fasta

数据准备好以后,登录在线网站上传蛋白序列, 在线进行蛋白注释,完成后下载注释结果 *emapper.annotations,并将其合并。

uniprot 注释

是一个提供蛋白质序列和注释数据的综合性数据库。对于序列数据库,我们会使用blastp/diamond这类软件进行比对。

由于 eggnog 数据库对细菌的 GO 注释信息包含很少,这里我们使用uniref90 数据库对氨基酸序列进行比对注释,并基于 idmapping 信息提取 GO 注释。

# 下载uniref90数据库
wget https://ftp.uniprot.org/pub/databases/uniprot/uniref/uniref90/uniref90.fasta.gz

# 下载id mapping文件 11G
wget https://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/idmapping/idmapping_selected.tab.gz

# 构建diamond database
diamond makedb --in ./uniref90.fasta.gz --db uniref90

# 进行diamond比对
diamond blastp \
--db ./uniref90 \ # db名称
--query unigene_pep.fasta \ # 输入,氨基酸fasta文件
--out unigene_pep.uniref90.m6 \ # 输出,表格格式
--threads 8 \ # 线程
--outfmt 6 \ # 输出blast表格格式结果
--max-target-seqs 5 \
--evalue 1e-5

# 基于idmapping 提取GO注释信息
perl uniref90_idmapping.pl \
unigene_pep.uniref90.m6 \ # 比对结果
./idmapping_selected.tab.gz \ # idmapping文件
> unigene_pep.uniref90.GOanno # 输出GO注释信息

# 构建orgdb,并统计GO 注释
Rscript GOmapperx.R unigene_pep.uniref90.GOanno

抗生素耐药基因注释

目前常用的耐药数据库:

  • ARDB数据库:


最早的耐药数据库,其核心架构包含完整的耐药基因序列以及,除此之外,还包括部分抗生素靶位点序列及其相关信息。目前ARDB已不再维护,相关信息已经被整合进CARD数据库,因此,目前常用CARD进行耐药性研究。

  • CARD数据库


CARD是一个基于志愿者贡献数据的耐药性研究共享平台,包括ARDB数据库的所有耐药基因信息,且更新很及时,从而保证了数据的时效性。CARD数据库以ARO为分类单位,在一个term中关联抗生素、作用靶位点、作用机制、序列变异等信息。除此之外,还包括一些毒力基因的信息、相关的可移动元件信息等。分析模式包括BLAST和RGI模式,除了可以对已知耐药基因进行注释外,还可以通过RGI预测潜在的耐药基因。RGI提供了3种预测标准,即Perfect、Strict和Loose;通过选择同源比对的判定标准,可以得到不同可信度和数量的潜在耐药基因,有助于发现新的耐药基因。

RGI 可以网页版运行,也可以安装在本地服务器,在线地址https://card.mcmaster.ca/analyze/rgi

# 下载CARD数据库参考数据
wget https://card.mcmaster.ca/latest/data
tar -xvf data ./card.json

# 准备输入文件
unigene_pep.fasta

# 加载数据库
rgi load \
-i ./card.json \ # 输入
--local # 数据库存放在当前目录

# 运行主程序
rgi main \
--input_sequence unigene_pep.fasta \ # 输入,氨基酸序列
--output_file rgi_out \ # 输出文件前缀
--input_type protein \ # 输入数据类型contig|protein
--alignment_tool DIAMOND \ # 比对软件
--num_threads 8 \ # 线程数
--local \ # 数据库在当前目录
--clean \ # 删除临时文件
--include_loose # 保留宽松比对结果

碳水化合物酶注释

碳水化合物酶注释的常用数据库为CAZy 数据库。

CAZy预测工具dbCAN2

这里使用 dbCAN2 提供的 run_dbCAN 本地版进行碳水化合物酶注释,dbCNA 也可以使用在线版,网址如下:dbCAN3 server (unl.edu)

# 使用diamond比对方法
run_dbcan \
--out_dir cazy_diamond \ # 输出目录
--db_dir 你的路径 \ # 数据库路径
--tools diamond \ # 使用diamond比对进行注释
--dia_cpu 8 \ # 线程数
unigene_pep.fasta \ # 输入,蛋白fasta序列
protein # 输入数据格式

# 使用hmmer结构域搜索方法
run_dbcan \
--out_dir cazy_hmmer \
--db_dir /app/db \ # 数据库路径
--tools hmmer \ # 使用结构域搜索进行注释
--dia_cpu 8 \ # 线程数
--hmm_cpu 8 \
--eCAMI_jobs 5 \
unigene_pep.fasta \ # 输入,蛋白fasta序列
protein

主要输出结果:

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,110评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,443评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,474评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,881评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,902评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,698评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,418评论 3 419
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,332评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,796评论 1 316
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,968评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,110评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,792评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,455评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,003评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,130评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,348评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,047评论 2 355

推荐阅读更多精彩内容