植物启动子-顺式作用元件-批量提取-预测-可视化分析

写在前面

以前总看到问题是,基因结构可视化的问题;现在则变成了启动子元件的预测或者说可视化。这本身比较简单,也比较玄乎,所以我一直不是太乐意与别人讨论。但学院今天断网,手上的工作无法正常开展。正好有旧友也问起,那么我就写写。
其实,有了TBtools,这些分析,所有人都可以极其快速的完成

顺势作用元件分析的顾虑

之所以说这个分析玄乎,在于他真的玄乎。顺势作用元件,基于其定义,并不一定就是启动子区域,也可以在内含子里面,还可以在邻近的基因里面。所以他跟启动子似乎并没有直接关系。只是,启动子从定义上来谈,就是RNA聚合酶(如pol II)被招募并结合的区域附近。这一区域应是有较多的转录因子(反式作用因子)和转录调节子,所以自然是存在较多的顺势作用元件。
说到这里,那么启动子区域的边界如何确定,又是玄乎的事情。几乎所有物种里面的UTR注释都是不全的,即使是拟南芥或者水稻,更或者人类。原因有很多。再从另一个方面来说。即使是同一个基因(locus),不同的转录本会有不同的转录起始位点,那么这个时候,哪一个TSS之上是所谓真实的启动子
总而言之,存在一个约定俗成(也就是大家都是看破不说破)的做法,取翻译起始密码子(ATG)上游1kb,或者2kb,或者更长一些。那么本文的做法就是,取2kb(注意,这个做法明显就是会包括一些UTR,然而似乎没有更好的做法)

实践一番

1.提取所有基因的启动子区域

首先是准备好输入文件

  • 基因组序列,即fasta序列
  • 基因结构注释信息,如gff文件
image.png

打开TBtools,使用gff3 序列提取工具,并设置到,只提取CDS上游2000bp的参数,如下

image.png

于是得到了拟南芥所有基因的CDS上游2kb(已经自动处理正反链)

2.提取目标基因集合的启动子序列

这一步比较简单,直接使用TBtools


image.png

查看下提取出来的文件信息是否正确


image.png

数目没错,长度没错,不过都是小写的。
3.将序列全部转换成大写
image.png
4.提交到PlantCare网站进行顺势作用元件预测

http://bioinformatics.psb.ugent.be/webtools/plantcare/html/

image.png

设置邮箱,选择要上传的文件(如果超过100kb,就用TBtools的Fasta Split 分割文件,逐个提交),点击上传,静等邮件
image.png

4. 整理和简化PlantCare分析结果

大概过了15min之后,邮箱提示收到邮件,是一个压缩包,解压即是
每一个序列对应了一个网页可交互的结果,而我们直接查看汇总文件即可

image.png

使用Excel打开,基于表格中的信息,如最后一列,筛选并保留有一定查看目的元件,如响应类元件
image.png

筛选后
image.png

剩下900多个元件,还是很多,接下来充分利用Excel的筛选工具(或者自己手动逐个修改)将同一类的响应类元件给与同样的标签,大概花了10来分钟....
image.png

接下来整理成适合于TBtools可视化的文本信息
image.png

5.使用TBtools对顺势作用元件进行可视化

首先需要准备一个序列长度文件,所有都是2000bp的启动子序列

image.png

随后是使用上一步得到的顺势作用元件位置信息,打开TBtools进行可视化
image.png

设置输入信息
image.png

点击Start即可得到图片...不过默认输出的图片有点长,基于JIGplot的特点,自己拖拽几下即可得到下图
image.png

可以看到,似乎有一个序列是AT1G35240.1带有明显增多的生长素响应元件?!具体生物学问题还是看做这个家族的人了。

6. 进化往往能告诉我们更多信息

于是我们把基于蛋白序列做的进化树也加上去
然后,如果你对TBtools的JIGplot引擎熟悉的话,直接用panelEditor调整两个Panel即可,如果不熟悉,那就。。。手动拖吧
可以得到下图


image.png

如果关注某个元件,如生长素响应,或者其他?


image.png

从预测结果来看?有部分ARF不受Auxin的直接诱导?少数的ARF可能会收到强烈有道?

写在最后

没想到,整理完这个教程花了一个来小时...
希望明天网络恢复正常。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,463评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,868评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,213评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,666评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,759评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,725评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,716评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,484评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,928评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,233评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,393评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,073评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,718评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,308评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,538评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,338评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,260评论 2 352

推荐阅读更多精彩内容

  • 什么是高通量测序? 高通量测序技术(High-throughput sequencing,HTS)是对传统Sang...
    oddxix阅读 7,222评论 0 44
  • 水榭闲塘莲叶碧, 芙蓉未雨淡胭脂。 紫笛弄色堪吹破, 邀月共吟杨柳诗。
    淡淡青莲阅读 377评论 25 21
  • 我决心改变自己,改变我的坏行为,坏习惯,除了我本身的意志和决心以外,有一个外在的环境是我始料未及的。 首先我很容易...
    g22n阅读 2,425评论 1 2
  • 可以通过重启 print spooler服务可以解决
    Cheer_up阅读 367评论 0 1
  • 贰·完败 话说血肆一心气走赤焰,但事实永远很残酷…… 午饭时间,血肆打横抱着苏仪来吃午饭(镜头要不要太无耻啊~...
    耳溪有你此生无憾阅读 1,020评论 0 0