对于通路分析结果的可视化而言,最常用的展现方式就是在通路中高亮显示富集到的基因。kegg 提供了在Color Pathway
在线服务,可以方便的完成这一任务。
网址如下:
这个工具使用比较简单,分为4步:
在
Select KEGG pathway map
输入框中输入想要标记的pathway ID ;在
Enter data
中输入需要标记的基因和对应的信息,或者通过选择文件
按钮,上传对应的文件;在
Option
中选择和上一步输入的文件格式相匹配的操作;点击
Exec
按钮,提交任务;
从上面的截图可以看出,这个工具提供了3种标记方式 ,下面我们以hsa05200
这条通路为例,看下实际用法
用指定颜色标记基因
输入文件的格式如下:
第一列为需要标记的基因或者KO,其他列为对应的前景色和背景色,背景色简单理解就是方框的填充色,前景色就是边框和文字的颜色。
每一列之间用\t
分隔,指定颜色的时候,可以有两种写法,第一种写法一列只有一个颜色,代表该颜色为背景色, 比如1630 blue
;第二种写法一列有两种颜色,两种颜色用逗号,
连接,则第一种颜色为背景色,第二种颜色为前景色,比如1630 blue,red
。指定颜色时,可以用常用的颜色名称,也可以是十六进制的代码,注意必须要有#开头的注释行,为每一列指定一个名称,这个名称是可以自己定义的。
示例:
#hsa highlight
1630 blue,red
836 blue
842 #00cc33
26060 #ff3366
999 #3366ff
标记的效果图如下:
用基因表达量标记基因
当使用基因表达量时,需要指定一个颜色范围,将数值映射到该颜色范围中去,适合展示表达量上的渐变关系。
输入文件一共两列,第一列为基因ID,第二列为基因的表达量(当然,这里的表达量可以是任何的数值,只要是你想要表示的数据即可,比如基因的长度,folg change 数值都可以),也是必须有#开头的表头
示例
#hsa count
hsa:25 678
hsa:861 26
hsa:867 13
标记的效果图如下
采用barplot 的形式表示基因
输入文件格式和第二种方法完全相同,最后会输出一个网页,将数值的转换为柱子的高度, 示意图如下:
总结
通过
color pathway
, 我们可以有多种方式在通路图中标记我们的基因,可以直接指定颜色,也可以将表达量等数值信息映射到图中。对于每种输入格式,必须要有
#
开头的注释行。color pathway
一次只可以标记1张通路图,不适合大规模的标记。