org.Hs.eg.db 包的使用

jimmy布置的个R语言中级作业中提到了几个R包,我查找了Bioconductor中org.Hs.eg.db包的使用说明书,为了自己更好的理解和应用,做了以下笔记。

首先了解一下基因芯片。 应用基因芯片可以直接检测mRNA的种类和丰度,基因芯片的原理是基于DNA的碱基配对,采用一段已知序列的核酸作为探针(prob)来检测与之配对的核酸序列。 根据探针制备和固定技术的不同,基因芯片主要分为两类 (1)寡核苷酸芯片(oligonucleotide microarray) (2)cDNA芯片(printed cDNA microarray)

在Bioconductor中有很多基因注释R包,其中org.Hs.eg.db就是一个人类基因的注释包,大多数注释包是在于AnnotationDb 的基础上改进的。

> if (!requireNamespace("BiocManager", quietly = TRUE))
 install.packages("BiocManager")
> BiocManager::install()
 BiocManager::install("org.Hs.eg.db")    # 下载安装 org.Hs.eg.db包,同时也会安装相应的依赖包
> ls("package:org.Hs.eg.db") # 查看有哪些包
 "org.Hs.eg" # Bioconductor annotation data package
 "org.Hs.eg.db"  # Bioconductor annotation data package
 "org.Hs.eg_dbconn" # 
 "org.Hs.eg_dbfile" 
 "org.Hs.eg_dbInfo"
 "org.Hs.eg_dbschema"
 "org.Hs.egACCNUM" #Map Entrez Gene identifiers to GenBank Accession Numbers 
 "org.Hs.egACCNUM2EG" 
 "org.Hs.egALIAS2EG"  #Map between Common Gene Symbol Identifiers and Entrez Gene 
 "org.Hs.egCHR"  #  Map Entrez Gene IDs to Chromosomes 
 "org.Hs.egCHRLENGTHS"   # A named vector for the length of each of the chromosomes 
 "org.Hs.egCHRLOC"   # Entrez Gene IDs to Chromosomal Location
 "org.Hs.egCHRLOCEND" 
 "org.Hs.egENSEMBL"   # Map Ensembl gene accession numbers with Entrez Gene identifiers 
 "org.Hs.egENSEMBL2EG" 
 "org.Hs.egENSEMBLPROT"  #Map Ensembl protein acession numbers with Entrez Gene identifiers 
 "org.Hs.egENSEMBLPROT2EG" 
 "org.Hs.egENSEMBLTRANS"   # Map Ensembl transcript acession numbers with Entrez Gene identifiers
 "org.Hs.egENSEMBLTRANS2EG"
 "org.Hs.egENZYME"    # Map between Entrez Gene IDs and Enzyme Commission (EC) Numbers
 "org.Hs.egENZYME2EG"
 "org.Hs.egGENENAME"   # Map between Entrez Gene IDs and Genes
 "org.Hs.egGO"       # Maps between Entrez Gene IDs and Gene Ontology (GO) IDs
 "org.Hs.egGO2ALLEGS"
 "org.Hs.egGO2EG"
 "org.Hs.egMAP"      # Map between Entrez Gene Identifiers and cytogenetic maps/bands
 "org.Hs.egMAP2EG" 
 "org.Hs.egMAPCOUNTS"     # Number of mapped keys for the maps in package org.Hs.eg.db
 "org.Hs.egOMIM"       # Map between Entrez Gene Identifiers and Mendelian Inheritance in Man (MIM) identifiers 
 "org.Hs.egOMIM2EG"
 "org.Hs.egORGANISM"      # The Organism for org.Hs.eg
 "org.Hs.egPATH"         # Mappings between Entrez Gene identifiers and KEGG pathway identifiers
 "org.Hs.egPATH2EG"
 "org.Hs.egPFAM"       #Maps between Manufacturer Identifiers and PFAM Identifiers
 "org.Hs.egPMID"      # Map between Entrez Gene Identifiers and PubMed Identifiers
 "org.Hs.egPMID2EG"
 "org.Hs.egPROSITE"   # Maps between Manufacturer Identifiers and PROSITE Identifiers 
 "org.Hs.egREFSEQ"     # Map between Entrez Gene Identifiers and RefSeq Identifiers
 "org.Hs.egREFSEQ2EG"
 "org.Hs.egSYMBOL"       # Map between Entrez Gene Identifiers and Gene Symbols
 "org.Hs.egSYMBOL2EG"
 "org.Hs.egUCSCKG"        # This mapping has been deprecated and will no longer be available after bioconductor 2.6\. See the details section for how you can live without it. For now, it is a map of UCSC "Known Gene" accession numbers with Entrez Gene identifiers
 "org.Hs.egUNIGENE"   #Map between Entrez Gene Identifiers and UniGene cluster identifiers
 "org.Hs.egUNIGENE2EG" 
 "org.Hs.egUNIPROT"     #Map Uniprot accession numbers with Entrez Gene identifiers

参考官方文档中给的例子,在Rstudio中跑几段代码并理解。

## select() interface: 使用select()函数
## Objects in this package can be accessed using the select() interface
## from the AnnotationDbi package. See ?select for details. 用AnnotationDbi包查看更详细的select()函数
​
## Bimap interface:
x <- org.Hs.egACCNUM #创建一个映射
# Get the entrez gene identifiers that are mapped to an ACCNUM
mapped_genes <- mappedkeys(x)  #将得到的Entrez Gene identifiers 与 GenBank Accession Numbers进行map
# Convert to a list
xx <- as.list(x[mapped_genes]) #as.函数转换成list列表形式
if(length(xx) > 0) {
 # Get the ACCNUM for the first five genes
 xx[1:5]   #获取前5个基因
 # Get the first one
 xx[[1]]    #获取第一个
}
#For the reverse map ACCNUM2EG:
# Convert to a list
xx <- as.list(org.Hs.egACCNUM2EG)
if(length(xx) > 0){
 # Gets the entrez gene identifiers for the first five Entrez Gene IDs
 xx[1:5]
 # Get the first one
 xx[[1]]
}

以上。

入门生信最快方式请搜索生信技能树

  1. 生信技能树全球公益巡讲
    https://mp.weixin.qq.com/s/E9ykuIbc-2Ja9HOY0bn_6g
  2. B站公益74小时生信工程师教学视频合辑https://mp.weixin.qq.com/s/IyFK7l_WBAiUgqQi8O7Hxw
  3. 招学徒
    https://mp.weixin.qq.com/s/KgbilzXnFjbKKunuw7NVfw
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,347评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,435评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,509评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,611评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,837评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,987评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,730评论 0 267
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,194评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,525评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,664评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,334评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,944评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,764评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,997评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,389评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,554评论 2 349

推荐阅读更多精彩内容