Mahmud SMH, Al-Mustanjid M, Akter F, et al. Bioinformatics and system biology approach to identify the influences of SARS-CoV-2 infections to idiopathic pulmonary fibrosis and chronic obstructive pulmonary disease patients. Brief Bioinform. 2021;22(5):bbab115. doi:10.1093/bib/bbab115
2021年2月发表在《Briefings in Bioinformatics》(IF=11.622;中科院2区)上关于新冠数据的非肿瘤纯生信文章~~~生物信息学和系统生物学方法验证SARS-CoV-2感染对特发性肺纤维化(IPF)和慢性阻塞性肺疾病(COPD)患者的影响
摘要
严重急性呼吸综合症冠状病毒-2(SARS-CoV-2) ,更广为人知的名字是2019冠状病毒疾病(COVID-19),已经成为当前人类的一个威胁。Sars-cov-2病毒的第二波已经袭击了许多国家,确诊的COVID-19病例正在迅速蔓延。这种流行病仍在经历可怕的阶段。患有特发性肺纤维化(IPF)和慢性阻塞性肺病(COPD)是COVID-19的危险因素,但是 IPF、 COPD 和 COVID-19背后的分子机制尚不清楚。为此,研究者利用转录组分析来检测 IPF、 COPD 和COVID-19中常见的通路和分子生物标志物,有助于理解 sars-cov-2与 IPF 和 COPD 患者之间的联系。
本研究利用基因表达综合集(GEO)中的3个 RNA-seq 数据集(GSE147507、 GSE52463和 GSE57148) ,检测 IPF 和、COPD 和COVID-19患者的共同的差异表达基因(DEGs) ,以寻找共同通路和候选药物。在这三个数据集中共识别出65个共同的DEGs。利用多种组合统计学方法和生物信息学工具构建蛋白质-蛋白质相互作用网络(PPI) ,从中识别出 Hub 基因和核心模块。此外,基于GO和KEGG通路的功能富集分析,发现 IPF 和 COPD 与COVID-19感染的过程有一些共同的联系。转录因子-基因相互作用、蛋白质-药物相互作用以及 DEGs-miRNAs 与常见 DEGs 的共同调控网络也在数据集中被确定。我们认为这项研究获得的候选药物可能有助于COVID-19的有效治疗。
流程图
方法及结果
1 数据收集和差异表达基因(DEGs)鉴定
从GEO数据库获取COVID-19、IPF和COPD的数据集。在转录水平的不同测试条件之间存在统计学意义上的显著差异时,一个基因的特征是表达不同。此分析的关键作用是首先获取数据集GSE147507、GSE52463和 GSE57148的DEGs,临界值(p 值 < 0.05和 | logFC | ≥1.0)用于检测所有数据集中的有效 DEGs。
GSE147507是COVID-19肺活检转录谱数据集,发现了1184个 DEGs (293个上调,891个下调);GSE52463包含8个 IPF 肺组织样本和7个健康对照组,其数据集中发现了1444个 DEGs (783个上调,661个下调) ;GSE57148收集了91例正常肺功能的患者和98例 COPD 患者的数据集,数据集中发现了1461个 DEGs (1022个上调,439个下调)。
通过Venn图从 IPF、COPD 和COVID-19数据集中确定了65个共有的DEGs。
2 GO和KEGG通路富集分析
利用一个全面的基因集富集网络工具 EnrichR (https://maayanlab.cloud/EnrichR/)来描述DEGs 的生物学机制(生物学过程、细胞组成和分子功能)和信号通路( P值< 0.05)。
在生物学过程中,干扰素 γ 介导(7个基因)和细胞因子介导的信号传导途径(15个基因)是首选的 GO 术语。γ - 干扰素(IFN-γ)是一种细胞因子,在免疫反应中起着重要作用。IFN-γ 信号通路主要与炎症和细胞介导的免疫反应有关,也与免疫监视人类肿瘤细胞抗肿瘤细胞因子相关。在分子功能实验中,金属蛋白酶(5个基因)和金属内肽酶活性(4个基因)是两个最主要的 GO 途径。金属蛋白酶活性(MMP 组基因)影响呼吸系统疾病,包括 ARDS、急性肺损伤、肺癌和肺纤维化。在细胞组成部分,内质网膜管腔侧(6个基因)和 MHC 蛋白复合体(5个基因)的组成部分位于前列。对于SARS-CoV-2来说,膜蛋白、穗状糖蛋白和包膜蛋白在复制SARS-CoV-2过程中被植入内质网膜。
表2总结了生物过程、分子功能和细胞组分类别中的前10个术语。
图3在条形图中为每个类别线性描述了整个本体分析。
前10位 KEGG 途径包括移植物抗宿主病(GVHD)、同种异体移植排斥反应、1型糖尿病、自身免疫性甲状腺疾病、病毒性心肌炎、肠道免疫网络的产生、细胞粘附分子、人 t 细胞白血病病毒1型感染以及抗原处理和呈递。其中GVHD 是一种常见的由失调炎症细胞因子和细胞毒性 t 细胞效应介导的并发症。
图4用柱状图表示通路富集分析结果
3 hub蛋白及其子模块的分类
通过在线网站STRING基于所有DEGs构建PPI网络,并通过Cytoscape进行可视化,以预测常见的 DEGs 的相互作用和粘附通路,如图5所示,常见 DEGs 的 PPI 网络由781个节点和968条边组成。
通过 Cytoscape Cytohubba 插件对PPI 网络分析,我们将前14个(21.54%) DEGs 列为最具影响力的基因,并构建了一个子模块网络(图6)。hub基因为 NOTCH4、 FLNC、 Indian hedgehog (IHH)、 FOSL1、 CXCR4、 PSMB8、 DAXX、 RASD2、 EPN3、 DIRAS1、 BATF、 GDF5、 RGS4和 CD28。这些hub基因可以成为潜在的生物标志物,这也可能为研究疾病提供新的治疗策略。
4 调控相关signature的确定
使用 NetworkAnalyst 平台从 JASPAR 数据库中定位拓扑可信的转录因子(tf),NetworkAnalyst 是一个广泛的在线平台,用于元分析基因表达数据,并深入了解生物学机制、角色和解释。Tarbase 和 mirTarbase 是 miRNA-靶基因相互作用的主要实验有效性数据库。通过NetworkAnalyst 从 miRNA 与基因的相互作用中提取共有DEGs 相互作用的 miRNA,并将其应用于拓扑分析中。TFs-基因和 miRNA-基因相互作用网络均在 Cytoscape 进行描述。
分析TFs、miRNA与DEGs的相互作用,以发现常见的 DEGs 的转录和转录后调节因子。转录因子处理转录的比例以及miRNA 在转录后水平上在基因调控和 RNA 沉默中起关键作用。
图7展示了TFs与DEGs交互网络。已鉴定的 TFs,如 FOSL1、DAXX、 HSPB6、CFB、FLNC、VARS2、TMEM238、PSMB8、EPN3和 DNAAF1,与不同类型的呼吸系统疾病有关。
图8展示了miRNA与DEGs交互网络,预测了4个 miRNAs (hsa-mir-16-5p、 hsa-let-7e-5p、 hsa-mir-26a-5p 和 hsa-mir-146a-5p)与 IPF 和 COPD 的不同基因有关。
5 候选药物的鉴定
Drug Signatures database (DSigDB) 是识别与 DEGs 有关的靶向药物的全球档案馆。利用 DSigDB 通过 Enrichr鉴定 COVID-19, IPF, and COPD的DEGs的药物分子。通过蛋白质-药物相互作用的评估确定受体敏感性药物结构。
表4显示了 DSigDB 数据库中用于DEGs 的有效药物。鉴定出姜黄素,它用于与炎症有关的疾病。炎症反应表明身体对感染、毒素和伤害的保护机制。人体会从免疫系统释放一些化学物质来保护受损的细胞。
6 疾病相关性的鉴定
DisGeNET 是一个全面的基因-疾病联系数据库,通过 NetworkAnalyst 研究了基因与疾病的关系,以发现与常见 DEGs 相关的疾病及其慢性并发症。该研究对基因-疾病关联性的网络分析中,结果与COVID-19有关的各种类型的疾病,包括大脑、心脏、血液、肝脏、皮肤和不同种类的肺癌,如风湿性关节炎、精神分裂症、皮疹、异位性皮肤炎和常染色体隐性遗传性疾病与报道的hub基因相关。
研究结论
该研究在 IPF、COPD 和COVID-19的转录组分析的背景下,总结了这三种疾病基因之间的关系。在三个数据集中进行DEGs分析,鉴定共同的基因,找出 IPF、 COPD 和 Sars-cov-2影响肺细胞的疾病反应。生物信息学分析表明IPF 和 COPD 患者感染 Sars-cov-2的风险较高。利用数据集中的65个相互关联的共有基因获得 PPI 网络,并从 PPI 网络中鉴定出10个最重要的hub基因。通过检索 DSigDB 数据库,从hub基因提出多药物分子和药物-靶点相互作用,对 IPF、COPD 和COVID-19的分析指出了一种鉴别各种疾病感染的方法。因此,有可能减轻 IPF 和 COPD 患者受 Sars-cov-2影响的风险。
COVID-19是一种新近发现的疾病,关于其危险因素和疾病的研究还不多。目前,有一些疫苗可用于预防COVID-19。但是在某些情况下疫苗并没有显示出有效性,特别是对 sars-cov-2的不同变异体。该研究实施了转录组分析来检测 IPF、 COPD 和COVID-19中常见的通路和分子生物标志物,有助于理解 Sars-cov-2与 IPF 和 COPD 的联系。在这些疾病中发现了10种hub蛋白。所有这些hub基因在不同的功能突变中起着至关重要的作用。验证的 TFs 和 miRNA 与不同类型的呼吸系统疾病有关。因此,我们鉴定的基因可以成为COVID-19疫苗开发的一个新的治疗靶点。
参考:https://mp.weixin.qq.com/s/k7CGaUWpsQPzilYk4GJq5Q
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------I am a line!--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------