文献
2023
Nature Genetics
Distinct chromatin signatures in the Arabidopsis male gametophyte
研究背景
1、植物和动物在繁殖方式上有根本的不同。
在动物中,原始生殖细胞是在胚胎早期的原肠胚形成阶段产生的。相比之下,植物的生殖细胞是由体细胞发育而来的,此时发生了从营养到生殖的转变。此外,植物配子被认为具有全能性或多能性,而这些特性只属于哺乳动物的受精卵或胚胎干细胞。
在哺乳动物中,由于在配子形成和受精后的受精卵中观察到广泛的表观遗传重编程,因此认为表观遗传信息的代际传递是罕见的。在植物中,参数突变和表观等位基因等可以通过DNA甲基化的形式稳定地传递给后代。
植物组蛋白标记重编程的程度和机制的研究仍然很少。
2、一些证据表明,在植物的生殖细胞中可能已经清除了组蛋白修饰。例如,拟南芥的开花抑制基因FLC在寒冷冬季通过建立局部的H3K27me3区域被沉默,这种表观记忆在下一代中被重置以保持春化需求。有趣的是,在春化后观察到FLC在受精后重新激活,同时在成熟花粉中保持沉默。FLC上的重置机制相当复杂,涉及到H3K27me3去甲基化酶和转录激活因子,并且重置的时机可能在父源等位基因和母源等位基因之间有所不同。
3、在哺乳动物的生殖细胞中观察到DNA甲基化的全局耗竭。在精子成熟后,组蛋白逐渐被精蛋白替代,形成一个紧凑的精子染色质,不参与转录和DNA复制。值得注意的是,精蛋白向组蛋白的替换是不完全的,一些核小体保留下来,包括在胚胎干细胞中存在的许多双价启动子。
目前的证据表明,拟南芥雄性生殖细胞中的表观重编程与此有所不同。首先,无论是精子还是植物雄配子体的营养细胞,DNA甲基化并未在全局范围内耗竭。其次,拟南芥中不存在精蛋白,而组蛋白变体H3.10在拟南芥精子细胞中高度表达,并可能取代H3.1和H3.3。有人提出,通过H3.10对经典H3的替换、活性组蛋白去甲基化以及H3K27me3写入因子的低表达,拟南芥精子细胞中的H3K27me3标记全局丧失。然而,由于缺乏相应突变体中H3K27me3染色质免疫沉淀测序数据集,这些事件对H3K27me3重编程的贡献尚不清楚。有趣的是,H3.10的基因敲除并不影响生育能力。第三,鉴于通过RNA测序检测到大量转录本,拟南芥精子细胞可能具有转录活性。
本文亮点
在本研究中,我们解决了在雄配子体中排序细胞类型的ChIP-seq技术限制,并提供了小孢子(Ms)、精子(Spm)和营养细胞(Veg)的表观基因组景观的综合概述。我们的工作揭示了H3K27me3和H3K4me3在雄性生殖细胞系中的重编程动态和特征,并为代际间的表观遗传和重构提供了启示。
结论01 精子和营养核中明显的组蛋白修饰特征
Fig1a
通过细胞类型的分选,得到了雄配子体中的营养细胞核、精子细胞核以及小孢子,由于细胞起始量过于低,作者开发了一种超灵敏的ChIP-seq来获取三者以及幼苗的组蛋白修饰(Fig1a)。
Fig 1c
在四类细胞 (Ms-小孢子, Veg-营养细胞核, Sdl-幼苗, Spm-精子细胞核)中鉴定H3K27me3和H3K4me3的峰(Fig1c),在精子细胞核和营养细胞核中发现了大量特定于每种细胞类型的H3K27me3峰值,这表明在雄配子体发育过程中存在普遍且特定于细胞类型的H3K27me3重编程。
Fig S3a
与幼苗和营养细胞核相比,精子细胞核Spm中的H3K27me3在转录起始位点(TSS)周围富集更多,而H3K4me3的整体分布模式在所有四种细胞类型中相似(Fig S3a)。
Fig 1d, e
FigS8
被H3K4me3标记的基因与所有四种细胞类型中的mRNA表达相关(Fig1d,FigS8)。
精子细胞核Spm中的H3K27me3标记基因也与mRNA表达相关(Fig1e,FigS8)。
因此,精子细胞核和营养细胞核具有不同的染色质特征,表明在雄配子体发育过程中存在复杂的组蛋白修饰重编程。
01 生信分析
ChIP-seq call peak
metaplot
peak与基因关联
基因表达量的箱线图
结论02 精子染色质具有广泛的二价性
Fig 2a
Fig 2d,e
HBGs标记基因的表达量更高(Fig2d, e)
Fig 2f
对于这些二价标记的基因,散点图展示了H3K247me3 和H3K4me3有明显的正相关,箱线图把这些区域根据两种组蛋白修饰的密度从高到低分成四份,也发现了组蛋白修饰与基因表达正相关(Fig 2f)。
02 生信分析
两组区间的韦恩图以及显著性检验
相关性分析
结论03 CBG和HBG通过不同方式建立
Fig 3a, c
对精子细胞核Spm的HBGs进一步研究发现,HBGs邻近的H3K27me3和H3K4me3都类似于体细胞中的典型H3K4me3模式,在TSS周围富集(Fig 3a)。
并且,HBGs在幼苗和小孢子中基本不含H3K27me3,而在小孢子中主要被H3K4me3标记,所以作者推断,HBGs周围的二价区域主要是在小孢子形成之后通过TSS周围H3K27me3的获得而建立的。
与HGBs相反,CBGs通常以H3K27me3和H3K4me3扩散到基因体区域为特征,再现了体细胞中典型的H3K27me3模式(Fig 3c)。
大多数CBGs在幼苗和小孢子中都有H3K27me3标记,并且H3K27me3从幼苗到小孢子有轻微的减少趋势(图3c)。相反,H3K4me3从幼苗积累到小孢子,并进一步积累到精子。因此,典型H3K27me3的存在可能是CBGs周围二价区域形成的先决条件。
03 生信分析
特定基因附近的组蛋白信号metaplot
结论04 CBG和HBG有不同的功能
Fig 3e, f
对HBG和CBG进行功能富集发现,HBG显著富集到与精子发生密切相关的功能(Fig 3e),比如与DNA复制和修复相关的基因被显著富集。
对于CBGs来说,参与代谢过程的基因,比如参与果胶和其他多糖代谢的基因被显著富集(Fig 3f),而它们在小孢子和精子中都是沉默的。有趣的是,这些基因在精子中并不是必需的,但在受精后胚胎细胞分裂过程中,它们对细胞壁的形成很重要,因此CBGs也可能处于静止状态,等待受精后的激活或抑制。
04 生信分析
GO功能富集
结论05 H3K27me3的重置发生在整个配子发生过程中
Fig 4a
Fig 4b
为了探究组蛋白修饰在配子发生的过程中是否发生全面清除,作者观察了幼苗(体细胞)中被H3K27me3标记的所有基因,并根据它们在精子中的状态分成5份(Fig4a)。
整体而言,从体细胞到精子,H3K27me3发生了整体上的下降。HBG是例外,因为它们通常在整个种系发育过程中获得H3K27me3。然而,在精子中还是有许多体细胞H3K27me3的peak区域仍然在被H3K27me3标记,特别是在CBGs和与H3K27me3单价结构区相关的基因上。
作者进一步量化了H3K27me3从幼苗到精子的减少,重点关注了5804个在幼苗中显示H3K27me3 ChIP-seq信号 RPKM>20 的基因,以获得高信度。其中,3346个基因减少2倍以上,714个基因减少4倍以上(Fig 4b),这714个基因被定义为“重置基因”,因为它们周围的H3K27me3被相对完整地去除。
Fig 4c
Fig 4d
进一步分析发现,在基因上H3K27me3的重置在小孢子中已经开始(Fig 4c, d),这表明重置是一个渐进的过程,通常在小孢子形成之前就开始了。
metaplot分簇-带散点的箱线图
05 生信分析
metaplot分簇
带散点的箱线图
结论06 H3K27me3在发育调控中重置
Fig 4e
Fig 4f
体细胞H3K27me3在部分基因上的缺失的意义是什么?作者进一步探究。在H3K27me3重置基因中,花轮发育基因显著富集(Fig 4e),包括AG、PI和SEP1、SEP3(Fig 4e-g)。
Fig 4g
体细胞H3K27me3在部分基因上的缺失的意义是什么?作者进一步探究。在H3K27me3重置基因中,花轮发育基因显著富集(Fig 4e),包括AG、PI和SEP1、SEP3(Fig 4e-g)。
有趣的是,这些基因在花分生组织中特异性表达,以促进雄蕊的形成(Fig 4f,g),雄蕊是产生雄性配子体的器官,这表明它们的H3K27me3水平在种系指定之前被重置。
这些基因表明,在小孢子形成之前,重置可能发生在多个时间点。
Fig 4h
相反,与胚胎模式形成相关的基因,如FUS3、WOX11和XND1,在小孢子中仅显示H3K27me3的轻度减少(Fig 4h),这表明它们的重置主要发生在小孢子形成后。
Fig 4i
有趣的是,尽管重置基因的mRNA水平在精子中通常无法检测到,但它们通常在精子形成之前或受精后表达(Fig 4i)。因此,在雄性生殖系中存在一种机制,以使重置基因处于沉默状态。
上述情况对于FLC也是适用的,FLC是表观遗传重置的典型例子。在小孢子中已经开始对FLC进行重置(Fig 4h),并在早期胚胎中保持沉默状态,直到下一代出现转录激活因子LEC1。因此,在受精后可能会发生表观基因组的进一步重编程,并且精子中缺乏H3K27me3可能会降低胚胎中一部分基因(如FLC)的激活阻碍。
06 生信分析
测序数据的局部展示
热图
结论07 H3.10的掺入增强了精子染色质特性
Fig 5b-d
有观点认为,精子中存在一种特异的组蛋白变体H3.10,它可能通过渗入和替换传统的组蛋白H3.1,导致精子中的H3K27me3发生重置。通过研究H3.10基因敲除突变体(htr10)中精子的染色质修饰,我们观察到WT和htr10共有7,718个H3K27me3峰发生重叠,占野生型的Spm H3K27me3峰的74%(Fig 5b)。值得注意的是,有4,230个htr10特异的H3K27me3峰(Fig 5b,group1),表明H3.10有助于对抗精子中的H3K27me3。有趣的是,与WT和htr10共享的峰相比,htr10特异的峰在幼苗中通常显示出更低水平的H3K27me3(Fig 5b,c),这表明H3.10更常在非典型的H3K27me3区域中对抗H3K27me3。事实上,在典型的H3K27me3区域中,htr10中的H3K27me3仅略微增加(Fig 5d)。
Fig 5f
Fig 5g
4,230个htr10特异的H3K27me3峰在营养细胞核中被H3K27me3标记,这表明H3.10在精子中的掺入主要用于对抗那些在营养细胞核阶段进一步建立的H3K27me3区域(Fig5b, c, f)。另外,一些H3K27me3峰在htr10中消失,表明H3.10可能在塑造HBGs的H3K27me3中也发挥作用(Fig 5b, c, g)。
07 生信分析
韦恩图
metaplot分簇
测序数据的局部展示
箱线图
热图
结论08 许多H3K27me3单价区域在营养细胞中建立
Fig 6a, b
与动物不同,开花植物产生不活动的精子细胞,这些细胞通过由营养细胞发育而来的花粉管传递。
因此,我们研究了营养细胞染色质在受精过程中如何配置以适应其功能。根据组蛋白修饰把营养细胞染色质可分为三类,发现H3K27me3单价峰与转录抑制有关,而二价峰和H3K4me3单价峰与基因表达相关(Fig6a)。与精子Spm相比,营养细胞Veg染色质有大量的H3K27me3单价峰,其中包括许多Veg特异性峰(Fig 6b)。
Fig 6c
Fig 6d, e
将与H3K27me3单价峰相关的基因根据它们在幼苗中的H3K27me3水平分为四个四分位数,并观察相应的营养细胞、小孢子和幼苗中的H3K27me3和H3K4me3模式(Fig 6c)。
发现第一和第二四分位数通常在幼苗和小孢子中含有H3K27me3(Fig 6c),发育调节因子和次生代谢基因等典型PRC2靶点富集在第一四分位数中(Fig 6d)。
相反,第三和第四四分位数中的基因通常在幼苗和小孢子中不含H3K27me3(Fig 6c),而在后者中标记有H3K4me3,表明这些H3K27me3区域是在营养细胞中新建立的(Fig 6c)。与细胞周期和减数分裂相关的基因富集在第四四分位数中(Fig 6e);这些基因在减数分裂和花粉有丝分裂I中起重要作用,但在进入G0期和停止分裂的营养细胞中不起作用。
08 生信分析
箱线图
多组区间韦恩图
metaplot分簇
GO功能富集
结论09 授粉相关基因被基因体H3K4me3标记
Fig 6f
对授粉和花粉管生长重要的基因(如BUPS150,ANX1和ANX2)在营养细胞中是高度表达的。有趣的是,在营养细胞中,这些基因主要由H3K4me3标记 (Fig 6f)。
Fig g-i
进一步作者开始研究H3K4me3与基因相对分布模式是否对营养细胞中基因表达存在影响。
作者根据H3K4me3在基因上的分布模式对基因进行聚类,发现营养细胞中的一部分基因(1,338个基因;Fig 6g)的H3K4me3结域覆盖了整个基因区域,但在幼苗(体细胞)中却没有(Fig 6h)。这些基因的表达水平高于那些在TSS周围有H3K4me3峰值的基因,并且富集到与花粉管和授粉相关基因(Fig 6i)。因此,营养细胞中gene body区域的的H3K4me3对基因表达是至关重要的。
09 生信分析
测序数据的局部展示
热图
箱线图
结论10 营养细胞染色质的独特特征
Fig7a, b
Fig 7c-e
由于精子Spm和营养细胞Veg在视觉上有明显差异,所以推测它们在染色质可及性等方面存在差异。
作者在精子和营养细胞核中生成了ATAC-seq数据和H3K9me2的ChIP-seq数据,发现营养细胞染色质在基因体、基因间区域和着丝点周围区域通常比精子和幼苗更容易接触(Fig 7a-d)
此外,营养细胞中着丝点周围区域的染色质可及性增加并伴随了H3K9me2的增加(Fig 7e)
10 生信分析
测序数据的局部展示
metaplot
饼图
全基因组密度图
结论11 特定染色质的domain具有明显的可及性
Fig 7f
Fig h, i
最后,我们研究了染色质可及性与组蛋白修饰之间的关系。我们发现,HBGs的启动子在所有Spm染色质区域中显示出最高水平的染色质可及性(Fig 7f, h),这表明HBGs可能具有更高的表达潜力或已经被活跃的表达。相比之下,CBGs的启动子、H3K27me3单价基因和重置基因的染色质可及性要低得多(图7f, i)。有趣的是,CBGs的染色质可及性明显高于H3K27me3单价基因(Fig 7f),尽管两组基因均未表达。
Fig 7g
Fig 7k
在营养细胞中,不同的染色质区域通常比精子中的相应类型更加开放,除了双价染色质区域(例如,精子中的HBGs)(Fig 7g)。此外,基因体H3K4me3区域在不同染色质区域中显示出最高水平的染色质可及性(Fig 7g,k)。综上所述,不同的染色质区域在染色质可及性方面具有明显差异,这不仅仅是表达水平的简单反映,而可能是它们转录潜力的指示器。
11 生信分析
箱线图
测序数据的局部展示
总结
这项研究创立了一种超高灵敏度的染色质免疫共沉淀测序(ChIP-seq)方法,适用于植物雄配子体细胞。该方法与染色质开放性测序(ATAC-seq)和单细胞转录组测序(scRNA-seq)等多组学技术相结合,首次揭示了模式开花植物拟南芥在雄性生殖细胞系的发育和成熟过程中,组蛋白修饰H3K27me3和H3K4me3的重编程特征和机制。这项研究为我们理解植物表观遗传信息在代际间的遗传和重置过程提供了重要参考。
本文使用 文章同步助手 同步