The BioGRID interaction database: 2019 update
BioGRID(Biological General Repository for Interaction Datasets)生物学互作数据库
生物相互作用网络,是由大量单个蛋白质或遗传相互作用以及RNA,DNA,膜,碳水化合物和小分子代谢物的相互作用聚集形成的,是理解基因-表型关系和所有细胞功能的基础。生物网络已被用于促进药物靶点的选择,解释耐药性或脱靶效应,并为靶向疗法和个性化药物奠定了基础。
BioGRID(BioGRID:https://thebiogrid.org)通用生物学互作资源数据库,致力于所有主要模式生物物种和人类的蛋白质,遗传和药物相互作用的管理和存储
一、BioGRID****数据库以及现阶段存储数据情况
图示数据库中各物种的蛋白质互作(PI)和基因互作(GI)的数据更新情况:
1.BioGRID数据逐年增长:
2.BioGRID相关项目
最近,BioGRID与生物医学数据翻译器支持的小组合作开展了两个新的主题项目(参阅https://ncats.nih.gov/translator)。
在一个项目中,BioGRID整合与FA途径相关的相互作用,这有助于介导DDR,并与多种人类癌症有关。在与FA专家协商后,BioGRID汇总了53个DDR基因的核心清单,这些基因与20个已知的FA核心基因相关,这些基因最初是由人类患者的基因互补组定义的。使用这些基因列表作为切入点,策划了来自2200多种出版物的12960种相互作用。
与生物医学数据翻译器相关的第二个新主题项目着眼于年轻人的成熟期糖尿病(MODY),这是一种常染色体遗传性疾病,其特征是胰腺细胞的遗传缺陷损害了胰岛素的产生(48)。目前,有14个基因与各种MODY亚型遗传相关,其中四个基因(HNF1A,HNF4A,HNF1B和GCK)已知占MODY病例的90%以上(49)。迄今为止,从这14个切入点开始,从149个出版物中选出了483个蛋白质相互作用的MODY网络。
FA和MODY交互作用数据集将用作通过生物医学数据翻译器计划开发的预测计算方法的输入和基准
3.BioGRID还与模式生物数据库和元数据库资源合作,促进BioGRID记录的广泛传播
4.遗传相互作用数据
为了协调和统一不同模式生物研究中使用的各种遗传相互作用术语,BioGRID与WormBase合作开发了新的标准化遗传相互作用结构术语或GIST。GIST已设计为使用通用遗传相互作用术语精确指定遗传相互作用,并得到其他模式生物的支持,包括SGD,CGD,PomBase,ZFIN,FlyBase和TAIR。在不同的模式生物中实施GIST将有助于解释遗传相互作用,以及整合跨多个物种的大量遗传相互作用数据。
5.药物相互作用数据
BioGRID已合并了DrugBank中的化学-蛋白质相互作用记录,现在手动管理小分子-基因和-蛋白质的相互作用。检索匹配了主要药物相互作用数据库的内容,包括DrugBank,BindingDB,CTD,PharmGKB,ChEMBL等来确定每种资源共有的字段。BioGRID已从DrugBank导入了药物靶点数据记录,其中包含> 10 560个实验且已获批准药物和> 4 490种蛋白质,涉及27 785种化学相互作用,来自21种生物的5035个小分子和2527个蛋白质靶标,包括人类,HIV-1,白色念珠菌和大肠杆菌。
6.CRISPR/CAS9数据
为了整合多个模型生物的CRISPR筛选数据集,建立一个CRISPR数据存储单元Open Repository for CRISPR Screens (ORCS) within BioGRID(https://orcs.thebiogrid.org)
BioGRID提供CRISPR数据包括sgRNA库名称,Cas9变体(CRISPRn,CRISPRi,CRISPRa),方法,酶,细胞系,细胞类型,生物,实验设置,持续时间,选择条件,筛选类型,表型,通量,筛选格式 ,得分类型,分析方法和显着性阈值
迄今为止,BioGRID ORCS注释了来自36种研究的人和小鼠细胞系的505套数据,总共应用了14种不同的统计方法。
二、数据库页面和数据下载介绍:
1. 主页直接检索
输入基因或蛋白标识符:
结果页面:
(1)提供该基因涉及的GO生物学进程、功能以及细胞组分
(2)可直接下载该蛋白的互作数据
(3)统计每种相互作用类型的数目和比例
(4)详细的互作情况展示
(5)互作网络展示
(6)药物互作
(7)转录后修饰位点
2.数据下载
(1)当前版本:我们的交互数据的最新版本。
(2)先前版本:上个月的交互数据集。
(3)发布存档:不再受支持的淘汰数据集。
(4)已发布数据集:与已发布文章相对应的数据集。
(5)其他数据集:各种用途的随机数据集。
(6)最新版本:在此目录中,所有文件均以LATEST而不是版本号命名,以允许脚本式下载
(7)外部数据库构建:专门为其他数据库构建的数据集,以链接到BioGRID数据。
(8)Cytoscape插件:BioGRID团队创建的用于Cytoscape软件的插件和工具
最新版本是BioGRID发表的3.5.177版本的数据。
最新版本截止2019年5月25日更新。如果您要使用BioGRID的数据开始一个新项目,则强烈建议使用最新版本的数据文件,即使用在CURRENT RELEASE目录的数据集
Current Release目录:
3.工具
相关资源链接:
(1)BioGRID ORCS
(2)PhosphoGRID :酿酒酵母(Saccharomyces cerevisiae)中1495个基因产物上5000多个特定磷酸化残基的位置。每个站点都记录有实验证据代码的层次结构
(3)Yeast Kinome :酵母激酶-酿酒酵母激酶和磷酸酶相互作用组(KPI)资源。(4)Pathway Commons:来自多种生物的公开通路的集合。
(5)iRefWeb :将来自不同数据库的交互记录分组到单个非冗余视图中。
可视化工具:
(1)Osprey:网络可视化系统-Osprey是用于复杂交互网络可视化的软件平台。Osprey利用BioGRID维护的基因本体(GO)注释的交互数据构建了数据丰富的图形表示。
(2)Cytoscape:是一个开放源代码生物信息学软件平台,用于可视化分子相互作用网络并将这些相互作用与基因表达谱整合在一起。
(3)NDex-NDEx:项目提供了一个开放源代码框架,科学家和组织可以在其中共享,存储,操纵和发布生物网络知识。
(4)Prohits-Viz:一套用于分析和可视化屏幕以及蛋白质-蛋白质相互作用数据的网络工具
(5)GeneMANIA:使用大量功能关联数据来查找与一组输入基因相关的基因。
(6)esyN:显示与主要数据库集成的在线交互网络,因此您可以在构建网络时自动检索数据。
文献来源:
Oughtred, R., Stark, C., Breitkreutz, B. J., Rust, J., Boucher, L., Chang, C., et al.(2018). The BioGRID interaction database: 2019 update. Nucleic Acids Res. 47,D529–D541. doi: 10.1093/nar/gky1079