欢迎关注公众号oddxix
KEGG 简介
KEGG全称: Kyoto Encyclopedia of Genes and Genomes
KEGG是一个整合了基因组、化学和系统功能信息的数据库。其中最核心的为 KEGG PATHWAY
和KEGG ORTHOLOGY
数据库。在 KEGG ORTHOLOGY
数据库中,将序列高度相似且行使相同功能的基因聚在一起,称为 Ortholog Groups (KO entries)
,每个 KO 包含多个基因信息,并在一至多个 pathway 中发挥作用。而在 KEGG PATHWAY 数据库中,将生物代谢通路划分为 6 类,分别为:细胞过程(Cellular Processes)、环境信息处理(Environmental Information Processing)、遗传信息处理(Genetic Information Processing)、人类疾病(Human Diseases)、新陈代谢(Metabolism)、生物体系统(Organismal Systems),其中每类又被系统分类为二、三、四层。第二层目前包括有 43 种子 pathway;第三层即为其代谢通路图;第四层为每个代谢通路图的具体注释信息。
KEGG主页
主页主要分为四大块
(1)以分类列表的形式介绍KEGG所包含的各个内容模块
(2)每个模块的直接入口
(3)特定生物体查询
(4)分析工具
模块1,可以了解KEGG数据库内部数据的流通和与其他数据库之间的关系。
模块2,是KEGG数据库的核心。
这里主要介绍KEGG PATHWAY
KEGG PATHWAY
一级分类
1. Metabolism
2. Genetic Information Processing
3. Environmental Information Processing
4. Cellular Processes
5. Organismal Systems
6. Human Diseases
7. Drug Development
点击三级分类的通路,就可以找到我们呢想要的pathway map 。
KEGG中存在三大类代谢图,每个数据路的pathway都有相应的唯一编号。
- (1)reference pathway
根据已有的知识绘制的、概括的、详尽的具有一般参考意义的代谢图。通路图中的小框都是白色,方便个性化填充颜色,在KEGG中名字以map开头,节点代表某一基因、该基因编码的酶及这个酶参与的反应。例如:map00010
方框一般就是酶,方框里面的2.7.1.1是EC编号;小圆圈代表代谢物,将鼠标放上面(需要在线版),会出现C00267,C代表compound,00267是这种化合物在KEGG中的编号
- (2)species-specific pathway
物种特有代谢通路图。绿色小框为该物种特有的基因或酶,只有这些绿色的框有更详细的信息。KEGG中名字为特定物种种属英文缩写,比如hsa04012:ErbB signaling pathway
- (3)以ko/ec/rn开头的Reference pathway
ko通路中的节点只代表基因;ec通路中的节点只代表相关的酶;rn通路中的节点只表示该点参与的某个反应、反应物及反应类型。底色以蓝色表示。
没有着色的路径图是由内部软件KegSketch手动绘制的原始版本。 具有着色的其他路径图全部通过计算生成如下:
Reference pathway:这是原始版本; 白色盒子与代谢途径中的KO,ENZYME和REACTION条目有超链接; 它们被链接到非代谢途径中的KO条目。
Reference pathway (KO):蓝色框被超链接到从原始版本中选择的KO条目。
Reference pathway (EC):蓝色框被超链接到从原始版本中选择的ENZYME条目。
Reference pathway (Reaction):蓝色框被超链接到从原始版本中选择的REACTION条目。
Organism-specific pathway:通过将KO标识符转换为参考途径中的基因标识符,绿色框被超链接到GENES条目,指示基因组中基因的存在以及途径的完整性。
信号通路图的官方解释https://www.genome.jp/kegg/document/help_pathway.html