R语言挖掘GEO数据库实战之-GEO库的概念及检索界面

GEO数据库是啥?

基因表达数据库(gene expression omnibus,GEO)

GEO是由美国国立生物技术信息中心(national center for biotechnology information ,NCBI)开发和维护的公共数据库,它存储基因芯片数据、新一代测序数据以及其他形式的高通量功能基因组数据,并将其发布供研究者自由使用。

目前GEO存储了约20000项研究得到了涉及50 0000样本,1300个物种,330亿单个基因的表达检测数据,这些数据是由世界各地的8000多个实验室提供的。GEO 数据库可以通过pubmed入口进行检索(见下图),也可以直接通过GEO库官网点击网址 进行检索。其检索界面见下图:

GEO检索界面.jpg

GEO检索界面基本信息

接下来简单的介绍一下GEO检索界面的基本信息,以cervical为例。

6.jpg

在这里我要特别重点介绍一下左侧的两个检索结果限定选项。(1)数据记录类型:导入GEO的数据类型主要分为四种:datasets,series,sampleplatforms,根据自己的需要选择,我们最常用的是series数据集。(2)检测类型:不同的实验检测类型不同,例如:DNA,mRNA,SNP,甲基化等,在检索时要结合自己的实验设计选择相应的检测类型。

最后,谢谢各位伙伴的支持,我是青盐,一个自学生信,并致力于在新疆推广生信分析技能的菜鸟,今天给大家分享的内容是使用R语言挖掘GEO数据库的基础知识部分,随后我会以一篇SCI文章为例,以案例结合知识点的方式给大家分享如何使用R语言挖掘GEO数据库,青盐在这里与每一位生信自学者共学,共勉,加油加油。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 健明大神说过若是想学会使用R包,就去看那个包的说明书,因此去学习了GEOquery包说明书。翻译不当之处请去看原文...
    土豆学生信阅读 41,912评论 1 80
  • [转] GEO数据库--检索界面及检索结果简介 原文:http://baijiahao.baidu.com/s?i...
    简单点lili阅读 93,700评论 3 56
  • 快乐不一定是拥有 坦然放手的成全 也会让你会心一笑 快乐不只是朝朝暮暮 两情若是长久时 咫尺天涯也不过是转身的距离...
    莺漫阅读 274评论 0 3
  • 西藏有一个地方,名不见经传,却被称为西藏的“西藏”, 这里既有壮丽的山川河流,又有神秘的神山圣湖; 图Byhuqi...
    背包旅行阅读 461评论 3 18
  • 我和妈妈和弟弟一起去逛超市,妈妈买了好多东西。在超市遇到了同学,我和他一起看书,我们一起看了童话书,我们都很开心。
    惠_8be5阅读 100评论 0 0