欢迎关注”生信修炼手册”!
在之前的文章中,我们提到利用网络聚类算法可以从复杂的蛋白质网络中挖掘蛋白复合体或者相应的功能模块,其中MCODE算法是最常用的挖掘蛋白复合体的算法。
MCODE全称molecular complex detection, 是最广泛使用的挖掘蛋白复合体的算法之一,在cytoscape 软件中提供了一个MCODE
插件,可以方便的对网络进行聚类。
cytoscape 是一个功能强大的网络可视化软件,除了基本的可视化之外,通过各种插件,还可以轻松的实现各种数据分析,插件的下载地址如下
http://apps.cytoscape.org/
众多插件中,也可以看到MCODE
插件的下载使用率名列前茅
在下载插件时,建议先打开cytoscape软件,这样可以直接在线安装,非常方便。
构建PPI网络,我们需要一个基因列表,比如转录组分析得到的差异基因列表,然后到String网站上,进行检索,示意如下
检索之后,下载tsv
格式的结果文件,示意如下
在该文件中,前两列的信息是我们需要的,内容如下
截取前两列,然后另存为一个文件,通常叫做edge.txt
。这个文件可以直接导入cytsocape软件,通过File->Import->Network->File, 将该文件导入,导入之后,通过Apps->MCODE, 启动MCODE插件,在控制面板,可以看到下图
选择默认参数,对整个网络继续聚类,在右侧的结果面板可以看到如下所示的结果
聚类之后会得到多个子网subnetwork
, 对于每个子网,可以看到其节点数,边数,打分值等基本信息,所有子网的信息可以通过Export
按钮导出到文件中,如下所示
点击每个子网,通过在中间面板看到该子网的可视化结果,示意如下
然后可以自定义的调整各项参数,使图片更加美观。通过MCODE
插件,我们可以方便的得到复杂瓦格的PPI网络中潜在的各个子网,但是后续还是要集合功能注释,比如KEGG,蛋白复合物数据库的注释等,对结果进一步解读和筛选。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!