DAVID数据库简介及使用说明

很高兴今天给大家介绍DAVID数据库,因为DAVID不仅是个生物数据库,也是一款在线分析软件。可以用来做基因的差异分析,也可用于通路的富集。他可以将输入列表中的基因,关联到生物注释上。依旧第一步,介绍DAVID网址:https://david.ncifcrf.gov 其实利用百度引擎也能快速检索到。在页面主页上,有该数据库的概要及其DAVID工具能够行使什么功能。具体如下图,有列表

1)Identify enriched biological themes, particularly GO terms

     2)Discover enriched functional-related gene groups

     3)Cluster redundant annotation terms

     4)Visualize genes on BioCarta & KEGG pathway maps

     5)Display related many-genes-to-many-terms on 2-D view.

     6)Search for other functionally related genes not in the list 

    7)List interacting proteins

     8)Explore gene names in batch 

     9)Link gene-disease associations 

     10)Highlight protein functional domains and motifs 

     11)Redirect to related literatures 

     12)Convert gene identifiers from one type to another.

And more 


鼠标移至“Shortcut to DAVID Tools”,下拉菜单中有四个主要功能1)Functional Annotation(功能注释)a)Functional Annotation Clustering:使用模糊聚类方法,对被注释上的 Terms 做聚 类,即 Terms 被分成多组,并将给出聚类的分值。分值越高,代表该组内的基因在基因列表中越重要。 b)Functional Annotation Chart:进行 GO 功能富集分析和 KEGG 

pathway 富集分析。C)Functional Annotation Table:该工具实现了基因的功能注释,将输入列表中每个基因在选定数据库中的注释以表格形式呈现。2)Gene Functional Classification(基因功能聚类),通常将功能相关的基因聚集在一个单元,分值越高,代表该基因重要性越高。3)Gene ID Conversion:对基因不同表示方法进行转换。4)Gene Name Batch Viewer:显示基因名称,ID,所属物种及相关基因。


接下来我们用示例来介绍它的功能注释,以PDCD1,CTLA4,LAG3,TNFRSF18,CD80 ,FOXP3 为例。首先我们选择“Shortcut to DAVID Tools”,再点击“Functional Annotation”。在左上角Upload中输入多基因列表,可以每行一个基因或者用逗号隔开。在选择相应物种,如人选择human,在选择identifier,如果是基因ID则选择GENE ID,这里我们是用了基因名称,选择了official-gene-symbol。下一步点击USE。在右侧跳出注释概要信息,点击“Disease”,我们可以看到这些基因和哪些疾病有关联。“Functional_Categories”功能类别,点击右侧长条可以显示这些基因参与了哪些功能,如凋亡,3D结构等。



继续下拉,有“Gene_Ontology”,主要包括三个方面,BP(生物学过程,biological process),CC(细胞组分,cellular component), MF(分子功能,Molecular Function)。通过GO富集分析,可以查阅这些基因生物学功能,定位和生物过程。


我们可以选择这三个TERM一起分析,如果需要单独分析,点击你想要分析的TERM,下拉菜单,点击“Function Annotation Chart”进行富集分析。在跳出来的结果中,我们发现有9个chart records,表格中右侧“count”则显示该TERM对应你的几个基因,点击上侧“options”,我们可以把FDR选择上(注:FDR:DAVID中的FDR要求自适应线性升压调整p值,以近似控制错误发现率,如Benjamini和Hochberg(2000)中所讨论的。使用最小斜率法估计真零假设的数)。右击“ DownloadFile”,链接保存txt格式后,用EXCEL打开该数据。



在打开的excel文档中,我们挑选GO-term, Count, p 值和 FDR 值。增加一列,对p值进行-LOG()转换,保存为文本格式。利用MID函数(字符串,起始位置,保留字符的个数)将TERM波浪号以及之前的内容删除,利用新的term和count进行作图,利用EXCEl的插入图形按钮,点击“二维条形图”进行绘制。这里我觉得WPS的表格比OFFICE好用的太多了。然后我们通过升序排列整齐。按自己的需求编辑表格格式。同样我们也可以粘贴为三线表格式。



前面介绍了利用DAVID在线分析工具进行GO注释,接下来介绍利用DAVID进行KEGG富集分析,操作如前,我们在LIST输入我们的多个基因,在功能注释界面,我们选择“Pathways”,同样我们以PDCD1,CTLA4,LAG3,TNFRSF18,CD80 ,FOXP3 为例。我们点击右上角“clear all”,选择“KEGG Pathway”,点击“Function Annotation Chart”,我们可以看到我们检索的基因有4个records。点击TERM,可以查到富集的信号通路,今天很意外的是我没有打开,可能服务器出现了问题,显示service unavailable。可能换个时间段就可以了。




另外我们常用功能就是对其GENE ID转换,如official symbols和 GENE ID间转换,这里就不一一演示了。

今天就简单介绍这里,咱们后期再见。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,451评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,172评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,782评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,709评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,733评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,578评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,320评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,241评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,686评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,878评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,992评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,715评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,336评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,912评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,040评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,173评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,947评论 2 355

推荐阅读更多精彩内容

  • 为了查找某个研究领域的相关信息,生物学家往往要花费大量的时间,不同的生物学数据库可能会使用不同的术语,好比是一些方...
    看远方的星阅读 17,859评论 0 6
  • 我们通过GEO或者其他数据库筛选出了一批显著差异基因,接下来就需要分析这些基因参与了哪些功能,我们下一步需要进行G...
    victor卡西莫多阅读 9,509评论 3 17
  • 网络:其实就是“图”,由点(node)和边(edge)组成一般来讲,探索基因表达数据的标准流程是这样: 差异表达分...
    Geekero阅读 4,649评论 0 18
  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 8,536评论 28 53
  • 信任包括信任自己和信任他人 很多时候,很多事情,失败、遗憾、错过,源于不自信,不信任他人 觉得自己做不成,别人做不...
    吴氵晃阅读 6,190评论 4 8