DisGeNET数据库介绍

数据库概况:

人类疾病遗传的基础是精确医学和药物发现的核心。数据的可用性、碎片化、异构性和概念描述的不一致性是疾病机制研究必须克服的问题。DisGeNET (http://www.disgenet.org)正是为了帮助科研工作者克服这些障碍而开发的数据库,它收集了大量与人类疾病(Mendelian, complex and environmental

diseases)相关的变异和基因。DisGeNET整合了公共数据库、GWAS目录、动物模型和科学文献的数据。该数据库的收据采用了统一的标准进行注释。此外,还提供了一些原始指标,以帮助确定基因型与表型关系的优先级。可以通过web接口、Cytoscape应用程序、RDF SPARQL终端、几种编程语言的脚本和R包访问这些信息。DisGeNET是一个多功能平台,可用于不同的研究目的包括特定的人类疾病的分子基础及其并发症的研究,致病基因特性分析,辅助构建药物治疗作用及药物不良反应假说,疾病候选基因的验证及文本挖掘方法的评价性能。目前最新版本的DisGeNET 为v6.0,它收录了17,549 个基因和 24,166 个diseases, disorders, traits, 及clinical or abnormal human phenotypes 间的628,685 个gene-disease associations (GDAs)。同时还收录了117,337 个变异和 10,358 个疾病、性状、表型间的210,498 variant-disease associations (VDAs)。可以通过疾病、基因或变异进行搜索。此外,该平台还提出了一个可以通过Cytoscape软件运行的插件。

DisGeNET gene-disease association type ontology:

数据库地址:

http://www.disgenet.org/home/

数据来源:

DisGeNET(v6.0)数据库主要来源于已知数据库和文献的文本挖掘。该收录的数据库情况如下表所示:

了解数据库更多信息:http://disgenet.org/dbinfo

数据库使用:

DisGeNET数据库有多重接口可供选择:

1.Web Interface

网页版的数据库主要包括检索、浏览及数据下载等几个主要功能。数据检索包括以基因、变异及者疾病为检索词进行检索:

浏览功能是以数据库为单位进行的,主要包括疾病信息、对应基因/变异信息、疾病与基因/变异关系信息、证据信息。以HPO数据库为例:

2.R Package

在R上安装disgenet2r包后后既可以进行DisGeNET数据库搜索,也可以进行可视化。但值得注意的是该R包目前的基于 DisGeNET v5.0 (May, 2017)。安装和使用示例如下:

安装:

##The package,disgenet2rcan be installed usingdevtoolsfrom this repository:

library(devtools)

install_bitbucket("ibi_group/disgenet2r")

数据库检索示例:

##以基因为检索词进行检索

library(disgenet2r)

gq<-disgenetGene(gene=3953,

    database="ALL",

    score=c(">",0.1))

##以疾病为检索词进行检索

library(disgenet2r)

dq<-disgenetDisease(disease="umls:C0028754",

    database="ALL",

    score=c('>',0.3))

3.Cytoscape App

安装:

需要预装Cytoscape,然后直接在Cytoscape安装DisGeNET插件。


使用:

打开Cytoscape,按如下顺序操作:

Cytoscape App主要功能就是将DisGeNET的数据用networks的形式进行展示,主要包括以下几个方面:

a)     Generate gene-disease networks:即基因和疾病间networks,例如HPO数据库中Asthma基因和疾病间networks示例如下:

b)     Generate variant-disease networks:即变异和疾病间networks,示例如下

c)      Generate gene or disease projection networks:即基因-基因间或者疾病-疾病间的networks,示例如下

d)     Create networks by DisGeNET association type:即检索某一关联关系,并将其可视化,如下面的The CURATED GDA network for CausalMutations

e)      Create networks by disease class:对某一类疾病建立network,如下是营养代谢病network

f)     Create networks by gene, disease, or variant:可以不限制具体哪两个(基因、变异、疾病)间的关系,而是通过过滤条件得到network,例如可以从以下几方面进行过滤:Source, Association Type,Disease Class, Score。下面是以MECP为检索词,过滤条件为Mental Disorders时构建的网络

g)     Multiple entity search in the DisGeNET App:包括匹配某一关键字的疾病或者基因的元素间构建网络、基于基因/变异列表构建网络。如下图是CTD数据库中Alzheimer相关的基因,包含了Alzheimer的所有亚型。

4.custom scripts

除了上述方法外还可以利用自己编写的脚本(R、python、perl、)来进一步使用数据库。例如可以利用以下脚本进行自动化:

a)    基于R进行自动化:见“disGeNETAutomation.R”

b)   基于python进行自动化:见“disgenet-automation.py”

数据库优势:

The highlights of DisGeNETare the data integration, standardisation and a fine-grained tracking of theprovenance information

参考文献:

DisGeNET: a Cytoscape plugin to visualize, integrate, search and analyze

gene-disease networks.2010 Bioinformatics. PMID: 20861032

DisGeNET: a discovery platform for the dynamical exploration of human

diseases and their genes.2015 Database. PMCID: 4397996. PMID: 25877637DOI: 10.1093/database/bav028

DisGeNET-RDF: harnessing the innovative power of the Semantic Web to

explore the genetic basis of diseases.2016 Bioinformatics. PMCID:4937199. PMID: 27153650.DOI: 10.1093/bioinformatics/btw214

DisGeNET: a comprehensive platform integrating information on human

disease-associated genes and variants.2017 Nucleic Acids Res. PMCID:5210640. PMID: 27924018. DOI: 10.1093/nar/gkw943

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,376评论 6 491
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,126评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,966评论 0 347
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,432评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,519评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,792评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,933评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,701评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,143评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,488评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,626评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,292评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,896评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,742评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,977评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,324评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,494评论 2 348

推荐阅读更多精彩内容

  • 目的: 利用高通量测序数据进行致病基因的挖掘,可根据样本情况采用不同的分析方法,但无论哪种方法最终都将面临从众多c...
    bioYIYI阅读 20,099评论 1 96
  • 转载 :https://www.plob.org/article/3856.html 生物信息数据库与查询 近年来...
    oddxix阅读 10,890评论 0 37
  • 肿瘤研究相关数据库: 最经典的Cosmic数据库COSMIC 全称:Catalogue of somatic mu...
    happyxhz阅读 6,506评论 0 19
  • 我要的自由哪! 黑暗中谁绊倒了我的马 背后的冷箭呼啸 要将一切希望都抹杀 我要的自由哪! 你们说好了给我鲜花 可是...
    日梦白阅读 163评论 0 1
  • 为什么你制定计划的时候信心满满,最后却总是完不成? 为什么我们明知概率极低,却依然喜欢买彩票? 为什么每一个决定都...
    无为_8a30阅读 516评论 0 0