中国春甲基化数据

中国春甲基化数据

表观遗传学中,甲基化的研究是重要的一块研究内容。最近小麦品种中国春的参考基因组在science杂志上发表。文章中有甲基化的数据,为了让大家在实际研究过程中方便的使用这个数据,我们特别邀请了中国农大的郭伟龙团队进行了数据的分析和处理,并最终呈现在我们小麦多组学网站上。下面我们具体介绍下这块内容。

1 数据来源:

NCBI登录号 SRP133674 ,

文章:Shifting the limits in wheat research and breeding using a fully annotated reference genome

取材时期

Cytosine methylation was profiled in DNA extracted from two-week old CS leaf tissue in three different contexts: CpG dinucleotides, CHG and CHH (where H corresponds to A, T or C).  The frozen leaves from the five samples at 3-leaf stage (Zadok stage 13) were ground and divided as input for the preparation of both RNA-seq libraries (detailed in

Chinese Spring tissues study) and whole genome bisulfite sequencing (WGBS) libraries.

2 结果描述

前面我们提到了这些数据来自science杂志上的中国春参考基因组。下面我们就总结下这篇文章中甲基化方面的结果。

Wheat DNA methylation frequency  of cytosines in the sequence contexts of CpG (average 92.7%), CHG (average 51.3%) and CHH (average 2.7%). The observed levels of cytosine methylations are among the highest observed in angiosperms (161), likely reflecting the abundance of repetitive elements throughout the wheat genome. Methylation patterns in wheat largely follow those observed in other species, showing enrichment in CpG and CHG sequence contexts at pericentromeric regions(gene poor) and depletion toward the chromosome ends (gene rich).

首先看一看high confidence genes的甲基化pattern。如下图所示,在基因编码区相对较低,CpG和CHG而在上有启动子和下游则相对较高。而CHH则相对较平稳。大家分析自己的基因时可以看看是否属于这个pattern。

high confidence genes

​                                        (TSS = transcription start site; TTS = transcription termination site)

High rates of DNA methylation likely serve to prevent transposition by restricting the expression of transposable elements. However, where repetitive elements are proximal to gene sequences, the enriched methylation can perform a regulatory function, predominantly silencing expression. The distinct and highly conserved methylation patterns observed in regions of HC genes and their regulatory regions showed higher levels of DNA methylation associated with the 5’ regulatory regions in all contexts that diminished rapidly at the transcriptional start site (TSS).

而low confidence (LC) genes的甲基化pattern又是如何呢?如下图,3种类型都相对平稳。

image-20181012160153303

​                                              (TSS = transcription start site; TTS = transcription termination site)

DNA methylation increased in the gene body where the CpG methylation formed a peak, whereas gene body methylation levels remained at extremely low levels at CHG and CHH sites. In the 3’ regulatory region after the transcriptional termination site (TTS) methylation rapidly reverted to the levels in 5’ sequences. This contrasted with the pattern observed for LC genes, where a near uniform level of methylation was observed in all sequence contexts. As a conclusion, many of the features included in the LC annotation are either no genes, are truncated or have lost their function through mutation (i.e. pseudogenes).

有一点很重要,甲基化也是一个动态变化的过程,不同发育时期,不同环境下都会发生变化。有些结论要辩证的看待。

![Copia repeat elements (https://wheat-1252088472.picsh.myqcloud.com/2018-10-12-080817.png), and D) Gypsy (RLG) repeat elements.](/Users/mashengwei/Library/Application Support/typora-user-images/image-20181012160511706.png)

​                                                                      TE序列相对来说甲基化程度要高很多

3 甲基化分析

农大的郭伟龙老师开发了甲基化mapping软件BS-Seeker2(BS-Seeker2: a versatile aligning pipeline for bisulfite sequencing data)以及后续甲基化分析软件CGmapTools(CGmapTools improves the precision of heterozygous SNV calls and supports allele-specific methylation detection and visualization in bisulfite-sequencing data)。

具体的分析流程见这里

需要注意的地方:

1、单条染色体需要拆分成两部分,即使用官方提供的161010_Chinese_Spring_v1.0_pseudomolecules_parts.fasta进行基因组index

2、使用bs_seeker2-call_methylation.py时不要整个基因组一起call methylation,一来速度太慢,二来整个基因组一起会出现bug(其他人有没有还不清楚)。我简单的说下我的测试过程,整个基因组进行call methylation,根据程序提示如果1A部分已经运行完毕,直接停止;分离出1A的bam文件单独对1A进行call methylation;将1A和2A合并到一起call methylation。最后发现,整个基因组call methylation的结果与其它两个均不同;而无论是1A单独还是1A和2A一起call methylation,结果都是相同的。

4 Jbrowse呈现

目前可以在我们网站(http://202.194.139.32)上查询感兴趣基因的甲基化水平。

绿色箭头处可输入转录本名字,如*TraesCS7A02G208100.1*


下面我们看一个例子。GS5基因在水稻中控制水稻的粒形和粒重,在小麦里中GS5(TraesCS3A02G212900LC, TraesCS3B02G277100LC和TraesCS3D02G172900)也已经被多个课题组同源克隆,其中3B基因有两处大插入,破坏了基因结构。从甲基化水平上来看,两处插入序列的甲基化水平较高(如下图)。

TaGS5


最后再强调一点,这里的甲基化是苗期叶片中的,不代表其他组织中的甲基化水平一定也是这样。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,324评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,356评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,328评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,147评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,160评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,115评论 1 296
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,025评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,867评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,307评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,528评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,688评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,409评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,001评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,657评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,811评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,685评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,573评论 2 353

推荐阅读更多精彩内容