摘要
两张图总结本文,以方便大家确定是否还有看下去的兴趣
写在前面
Emmm... 今天开放一个旧功能,全基因组基因密度统计。虽然是早前就写好的,但我一直没开放,主要是考虑到这个功能感兴趣或者用得上的人不多。没人用的功能,不会是好功能。然而,近日需要写一些 Usage Cases。TBtools 一贯风格是,任何人都能轻松掌握并完成数据处理-分析-可视化。要做让所有人都轻松,确实不是一个简单的事情。于是,我又打了一个GUI,看了下时间.... 十来分钟搞定。以下,分为两部分:
- 说明这个功能的使用方法
- 大体说明这个功能的用处
如何使用 Gene Density Profile
输入数据文件:GFF3 或 GTF 文件,即基因结构注释信息
首先,打开 TBtools ,并打开对应功能
随后,设置输入文件,并设置输出文件
文件不大,打开文件看看
一共四列,最后一列即为区域的基因数目,可以用于下游使用
Gene Location 功能上的应用
假定我们有一堆基因要展示其在染色体上的分布,如果使用 TBtools,那么有两种方式,这里不做赘述,其中一种是直接基于GTF/GFF3文件可视化。所需文件:
- GTF/GFF3文件,正如上述需要的文件
- 一堆基因ID,如下
使用 TBtools 可视化这些 ID 在染色体上的分布,如下
于是你会得到
看起来还是不错的。
如果这个时候 ,再加上基因密度
那么你会得到
看起来,似乎丰富了许多。
Circos 图上的应用
TBtools 的 Circos 功能目测已经有一些朋友在使用,前述的教程中,需要用户自行基于基因结构注释文件,以及一些简单文本操作,获得基因密度信息。现在则可以直接得到可用于输入的基因密度信息。【注,染色体长度信息,可直接从 TBtools 的 Fasta Stat 功能统计得到】
于是图片如下
一旦有了基因密度信息,那么可以有多重可视化方式,比如,热图 和 柱形图
或者更为复杂一下
我自认为,看起来还不错.....其实这也有彩蛋,Circos 图是支持只展示某个染色体的某个区域,比如,只显示Chr1的最后部分,
于是得到
Emmm... 标签的角度,是我手调的... 毕竟是我写的JIGplot引擎,支持交互操作,想调就调。
写在后面
其实,Gene Density Profiler,感觉上确实没有太大用处,主要还是简化或者降低一些工作量。Emmm... 似乎 TBtools 整体上也是。毕竟没什么特别的,都是通用功能,但常常就是通用的简单的事项,占据了我们 80% 的时间。
总之,TBtools,用过就后悔,后悔没早用。