前言
Immugent在之前写过一个推文:DisGeNET数据库:人类疾病相关基因研究的百科全书,介绍了一个人类疾病相关基因的综合数据库。DisGeNET是一个广泛使用的基因疾病关联数据库,可以为基因疾病关联研究、药物开发和个体化医疗等领域提供有用的信息和支持。
为了更方便地使用DisGeNET,R语言社区联合DisGeNET团队开发了disgenet2r包,该包可以轻松地从DisGeNET中提取数据和进行分析。disgenet2r包的主要功能包括:
1.数据提取:disgenet2r可以从DisGeNET中提取有关基因疾病关联的数据,包括基因-疾病关联得分、文献引用、疾病描述等。
2.数据筛选:disgenet2r可以根据用户定义的筛选条件,从DisGeNET中提取感兴趣的数据。例如,用户可以根据特定疾病或基因名称,筛选有关的基因疾病关联信息。
3.数据分析:disgenet2r可以进行基本的数据分析,例如绘制基因-疾病网络图、进行富集分析等。这些分析可以帮助用户更好地理解基因-疾病关联的复杂性和多样性。
主要内容
#安装和加载disgenet2r包:用户可以使用如下代码安装和加载disgenet2r包:
install.packages("devtools")
devtools::install_github("ropensci/disgenet2r")
library(disgenet2r)
安装好disgenet2r包后还不能立马使用,还需要注册一个账号,然后把账号信息导入才能调用DisGeNET数据库的资源,代码如下:
disgenet_api_key <- get_disgenet_api_key(
email = "user@email.com",
password = "myspwd" )
Sys.setenv(DISGENET_API_KEY= disgenet_api_key)
#连接DisGeNET数据库:用户需要通过如下代码连接DisGeNET数据库:
dgn <- DisGeNET()
#提取数据:用户可以使用如下代码从DisGeNET中提取基因-疾病关联数据:
gene_disease <- dgn$get_gene_disease_associations()
DisGeNET数据库几乎链接了目前所有疾病相关基因研究的数据库,而通过disgenet2r包可以直接调用这些资源用于我们的分析,可谓是非常方便了。[图片上传失败...(image-6135e-1682384899829)]
#数据筛选:用户可以使用如下代码根据特定条件筛选数据:
filtered_data <- filter_data(gene_disease, gene_name = "BRCA1", score = 0.5)
#数据分析:用户可以使用如下代码进行基本的数据分析:
network_plot(filtered_data)
enrichment_analysis(filtered_data, "GO:0008150")
展望
总之,disgenet2r包是一个非常有用的工具,可以为从DisGeNET中提取和分析基因-疾病关联数据提供方便和支持。我们可以使用disgenet2r包对任何差异分析或者功能基因进行疾病相关注释,从而可以更好的解释这些得到的关键基因集。
在本期推文中,Immugent只是对disgenet2r包做一个简短的介绍,后续生信宝库会持续推出一系列有关disgenet2r包代码实操的推文,敬请期待!