如何下载感兴趣的基因集（GO数据库）

需求：下载DNA损伤修复相关的基因列表。

第一步搜索数据库

进入GO (Gene Ontology) 数据库网页 http://geneontology.org/ ，在搜索框内输入感兴趣的内容，选择Gene Product，搜索。

tips: 搜索多个关键词时，若直接使用空格连接，则逻辑关系为OR。若要以AND关系搜素，需要加上双引号。

image.png

网可能有点慢，需要等待一会儿。

image.png

搜索出结果后，可以点Organism限定物种。

image.png

我们选小鼠的话就在小鼠前面的加号上点一下，然后等待。

image.png

可以看到我们搜到了489个结果。

第二步下载

接下来我们点Custom DL这个按钮来下载。

image.png

弹出来这么一个选择的面板（如果没弹出来，可能是被浏览器给禁止了，需要换个浏览器或者手动改一下设置），问你需要选择下载哪些信息。我们把左边的Gene/product(bioentity_name)以及Synonym(Synonym)选上（鼠标按住后拖动到右边），这两个分别代表了完整基因名和同一基因的其他名字。右边原来这两个是默认的选项，其中第一行Gene/product(bioentity)我觉得没什么用，我们把它移回到左边；第二行Gene/product(bioentity_label)很重要，我们让它保持在右边，它是基因标准的SYMBOL，将来ID转换全靠它。其他的信息可以根据自己的需要来选择（我也不记得每个选项分别是什么意思，有时间的话自己试一下吧）。

image.png

选好之后就可以download了，会弹出来一个网页：

image.png

在这个页面上是没有下载按钮的，这个时候需要按ctrl+s保存到自己的电脑上，保存类型就是.txt不用改。（如果你用的浏览器没有弹出这个页面，而是直接给你弹了一个下载窗口，那就直接下载就可以啦）。

这样就下载好了所有搜索到的基因啦~任务到这里其实就已经完成了。

下面是关于文本格式表格的一点点补充。如果你对\t分割的.txt文件很熟悉了，以下内容可以不看。

补充步骤1 用excel打开

作为一个后缀名为.txt的表格，它是以\t（也就是制表符，即tab）分隔的，可以直接读进R里进行操作。

如果想要打开看一眼，直接用记事本或者其他类似的文本编辑软件（我一般用notepad++）都可以打开。如果需要用excel打开它，可以参照下面的步骤：

1、先打开excel。

2、点击文件--打开--浏览

3、文件类型选择“文本文件”，这是我们刚刚下载的.txt文件就出现了。选择它，点打开。

image.png

4、这时弹出来一个文本导入向导，文件类型默认是“分隔符号”，不需要改。点下一步。

image.png

5、分割符号默认是“Tab键”，也不需要改。点下一步。

image.png

6、列数据格式默认是“常规”，我们要改成“文本”。改好了点完成。

image.png

7、这样就成功以表格形式打开.txt文件了。列宽可以自己拉一下，看起来顺一点。

image.png

补充步骤2 另存为表格格式

为了下次打开方便，我们可以另存一下。保存类型选择“Excel工作簿”或者“CSV（逗号分隔）”。

image.png

tips——xlsx格式和csv格式的区别：

如果选择Excel工作簿的话，适合自己看（重音在“看”），以及发给别人看（手机打开excel一般没有问题，但是CSV不一定能用手机打开）。如果选择CSV的话，不光可以看，还可以导入R用于后续的数据处理。但是CSV不能对表格的样式进行编辑（其实是可以编辑，但编辑的效果无法保存，下次打开以后仍然是简简单单的表格内容）。所以根据自己的需求选择就好了。

One more thing

用一种检索策略来检索往往不能得到所有我们想要的结果。比如，我们希望获得所有与DNA损伤修复相关的基因，可能就需要用"DNA repair"和"DNA damage response"这两种甚至更多的检索策略，然后把结果都下载下来，合并到一起分析。

但是这又产生一个问题——两次检索得到的基因可能有部分重叠，这就涉及到了去冗余的问题。这个操作用R是很好实现的，可以自己搜索一下教程，或者我帮你搜几篇也行（直接给你现成的代码也可以，但最好还是自己探索一下）。

2020.4.21更新
下载基因集远远不只有GO可以用，比如可以看《3大在线分析工具:Enrichr、WebGestalt、gprofiler与R包clusterprofiler的比较》https://mp.weixin.qq.com/s/EmVKSj3ddL89hi0s3lOnVA

最后编辑于：2020.04.21 18:05:03

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,277评论 6赞 503
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,689评论 3赞 393
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,624评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,356评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,402评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,292评论 1赞 301
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,135评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,992评论 0赞 275
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,429评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,636评论 3赞 334
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,785评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,492评论 5赞 345
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,092评论 3赞 328
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,723评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,858评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,891评论 2赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,713评论 2赞 354

如何下载感兴趣的基因集（GO数据库）

第一步 搜索数据库

第二步 下载

补充步骤1 用excel打开

补充步骤2 另存为表格格式

One more thing

推荐阅读更多精彩内容

第一步搜索数据库

第二步下载