文献
2023
Plant Biotechnology Journal
Genomic insights into selection for heterozygous alleles and woody traits in Populus tomentosa
课题背景
基因组分析表明,异种杂交和无性繁殖使大多数树种具有高度杂合性。在育种过程中,保留控制理想性状(如产量和耐旱性)的杂合位点是至关重要,这些杂合特征中的某些可能与自然种群的适合度有关。
有研究发现,6个核桃种间有害突变的遗传多样性和杂合性差异显著,表明有害SNP的杂合性在核桃进化中起着重要作用。然而,对于未驯化和长寿命森林中杂合度变化对数量性状的影响,以及种群适应进化中环境选择与杂合度变化之间的关系尚不清楚。
木材除了是满足人类需求的宝贵资源,还为植物的生长发育提供了一系列基本功能,包括机械支撑、水运输和有机化合物储存。因此,了解木材特性的遗传基础对于生态系统管理至关重要。全基因组关联分析和选择性扫描的联合分析已经揭示了表型变异的遗传基础,并确定了包含控制适应性状的位点的基因组区,然而,树木在环境选择下木材的遗传基础尚未得到检验。
中国白杨/毛白杨(Populus tomentosa, 2n = 38)生长迅速,木材品质优良,是研究进化过程中等位基因变异的优良系统。
在本研究中,作者对毛白杨染色体尺度参考基因组进行了从头组装,并分析了毛白杨群体中木材成分的遗传变异、群体结构、杂合特征和遗传结构。
结论1 毛白杨基因组的组装揭示了其进化关系
Table1
Fig 1a-c
作者选择了“天水”材料用作基因组组装。通过47.59Gb的PacBio Sequel数据、56.40 Gb的10X genomics数据和57.00 Gb的Hi-C数据进行组装。contig N50 是1.30 Mb,scaffold N50是19.10 Mb(Table1)。共注释到33,996个蛋白编码基因(Fig 1a),其中96.73%具有功能注释。利用4种杨树和1种柳树基因组的单拷贝同源基因进行了系统基因组分析(Fig 1b), 结果表明P. tomentosa和P. tremula 在8.94个百万年前发生分化,P. tomentosa和P. trichocarpa在14.14个百万年前发生分化。“天水”基因组的WGD事件与P. tremula 和P.Trichocarpa相同(Fig 1c)。
结论2 群体分析表明Pop_S是毛白杨的祖先
Fig 1d-h
通过对302份毛白杨进行重测序,鉴定到12.9M SNPs,1.9M InDels,54931个CNVs和1742个SVs。通过STRUCTURE分析、进化树和PCA,把这302份材料划分成三个主要的亚群,反映了它们的地理起源(Fig 1d-f)。Pop_S首先发生分化,意味着Pop_S可能包含了毛白杨的祖先株系,这一推测与之前的发现一致,即南方地区为毛白杨的起源中心。Pop_S的遗传多样性高于另外两个亚群(Fig 1g),Pop_Ne和Pop_NW可能存在瓶颈效应或选择。与其他两个亚群相比,Pop_S的LD衰减距离更短(Fig 1h),这与Pop_NE和Pop_NW可能出现瓶颈效应吻合。
Fig S3
通过估算有效群体大小,发现Pop_S在遥远的过去持续下降(Fig S3a),表明其后波动可能是导致Pop_S持续减少的原因之一。Pop_Ne和Pop_NW的瓶颈事件发生在LGM的极低温度期间,但是Pop_NW的有效群体大小在Pop_NE之前达到最低点并开始恢复(Fig S3b-c)。这些结果表明,在Pop_NE、Pop_NW和Pop_S分化之后,经历了不同的进化历史。
结论3 毛白杨的杂合选择特征
Fig 2a
与Pop_S相比,Pop_Ne和Pop_NW的杂合度明显降低(Fig 2a),这表明杂合度的降低可能是毛白杨在适应性进化过程中环境适应的结果。
Fig 2b-c
为了确定群体适应性进化过程中环境选择压力导致的杂合性降低的潜在信号,作者将Pop_NE、Pop_NW与Pop_S相比杂合度(Fig 2b)和核苷酸多样性(Fig 2c)均下降的基因组区域定义为杂合选择清除区域heterozygous selective sweep regions (HSSR)。
Fig 2d
与非HSSRs相比,HSSRs的群体分化指数更大(Fig 2d),这进一步证明了杂合性降低与环境适应有关的观点。
结论4 杂合度下降对群体水平基因表达和遗传负荷的影响
Fig 3a-d
遗传负荷(genetic load)是生物群体中由于有害等位基因的存在而使群体适应度下降的现象。在这一部分作者认为某个亚群有更多的有害等位基因就是有更高的遗传负荷。
适应性进化可以通过影响基因表达模式和/或编码区的等位基因频率的变化而迅速完成进化。为了追踪杂合性的进化历程,作者首先研究了不同基因组元件的杂合差异,包括2kb的启动子、UTR、内含子和外显子(Fig 3a-d),结果表明这些主要的基因组元件在杂合性表现出亚群间的显著差异。
Fig S4
为了探究群体进化过程中杂合度下降与基因表达变异的关系,作者选择了表达变异较大基因的启动子和外显子区域进行后续分析,将启动子和外显子区域(从Pop_S到Pop_NE或Pop_NW)杂合度下降较大的基因分别定义为启动子杂合基因(1352个基因)和外显子杂合基因(1822个基因)。
根据GO富集分析,1352个启动子杂合基因在发育过程中显著富集,1822个外杂合基因在对激素和非生物刺激的响应类别中表现出显著的富集(Fig S4).这一发现表明,在低杂合区域,选择对单个基因的启动子和外显子的作用是不同的。
Fig 3e
作者对30份材料做了转录组测序,根据全部基因、外显子杂合性基因和启动子杂合性基因的表达做了聚类(Fig 3e),发现全部基因和外显子杂合性基因的聚类结果与进化关系不一致,启动子杂合性基因的聚类与进化关系类似,能体现杂合的特点。这表明启动子的杂合导致了亚群之间基因表达水平的变异。
Fig 3f-g
为了更深入地研究杂合性下降在调控基因表达中的作用,作者将936个可检测到表达的启动子杂合基因分为10个共表达模块。随着杂合度的降低,模块2中有480个基因在Pop_NE和Pop_NW中表达升高,而模块8中有379个基因在Pop_NE和Pop_NW中表达下调,其中许多基因与生长发育有关(Fig 3f)。
Fig 3h-i
作者检测了群体中的有害等位基因,发现Pop_S的基因组杂合的增加与高遗传负荷一致(Fig 3h)。相比之下,Pop_NW的有害负担最低,这与杂合性变化一致,反映了在恶劣环境下生活的毛白杨亚群具有很强的净化选择。
作者进一步分析了Pop_NE和Pop_NW低杂合区减轻遗传负荷的机制,发现35.78%的有害等位基因从HSSRs中被去除,高于Pop_S全基因组的平均水平(Fig 3i)。这些结果表明,Pop_NE和Pop_NW的遗传负荷减轻是由于当地环境驱动的杂合性降低导致的。
Fig j-l
我国南部、西北部和东北部的地理区域主要以年降雨量和温度来区分,因此,作者比较了干旱和正常条件下的基因表达水平(Fig 3j-l)。与Pop_NE和Pop_NW相比,干旱对高杂合性的Pop_S的影响更为显著,因为在Pop_S中上调和下调的DEGs数量较多(分别为3711和2530)。
Fig 3m-n
作者对三种材料中的DEG做了upset图,发现更多的DEG是Pop_S在干旱处理后特有的(Fig 3m)。与正常条件相比,干旱条件下亚群间由杂合引起的启动子杂合基因的表达变化不再明显(Fig 3g)。并且 ,外显子杂合性基因更倾向是在各亚群表达一致(p=1.57×1e-9,Fig 3n)。
Fig 4a-d
作者比较了不同亚群木材成分的差异,Fig 4a-d展示了木质素和半纤维素的分布,表明在三个亚群中,都存在显著差异。具体而言,Pop_S的纤维素含量高于Pop_NE 和Pop_NW,而Pop_NW的木质素含量最高,这是环境选择的表型证据。
通过GWAS作者鉴定了影响毛白杨木材性状的63个候选基因,包括一个WRKY转录因子,之前已被证明与木材中的半乳糖醇相关,还有一种钙调蛋白,参与细胞壁的合成。
Fig 4e-j
根据HSSRs和GWAS联合分析,鉴定出6个基因与木材成分有显著关联,并且在Pop_NE和Pop_NW中伴随了杂合度的下降。其中有一个是PtoLOX3,它是一个外显子杂合基因,与木质素含量有关(Fig 4e-j)。
Fig 4k-m
该基因上鉴定到5个非同义突变,通过SIFT的预测15,722,133处的得分最低,导致了亮氨酸到丝氨酸的变异,其他4个SNP相对较保守(Fig 4k)。过表达PtoLOX3基因后叫对照提高了30.77%的木质素含量(Fig 4l-m),表明其在木材成分形成中的重要作用。
Fig 4o-v
PtoARF8被检测到与纤维素和半纤维素相关,并且在该基因邻近也检测到了杂合度的降低。在Pop_NE和Pop_NW中,PtoARF(AA)等位基因的纯合子频率高于Pop_S,但PtoARF(GA)和PtoARF(GG)等位基因的频率较低(Fig 4r),并且PtoARF(AA)等位基因的表达水平明显低于杂合的PtoARF(GA)(Fig 4t)。在烟草中证明,相对于PtoARF(GG)的启动子,PtoARF(AA)表现出更弱的转录激活(Fig 4u)。
通过转录组分析表明,PtoARF8的表达量在Pop_S中显著高于Pop_NE和Pop_NW(Fig 4v),这进一步证明了纯合子基因型的选择导致了PtoARF8表达水平的变化。
结论5 PtoARF8调控与毛白杨纤维素和半纤维素生物合成相关的基因的表达
Fig 5e-n
文章最后一部分,作者重点研究了PtoARF8的调控机制。PtoARF8在各组织中都有表达,在木质部中表达最高(Fig 5e)。与野生型)相比,所有检测的PtoARF8过表达系(PtoARF8- oe)的木细胞壁厚度显著增加(Fig 5f-j)。这一观察结果可能归因于这些过表达系中纤维素和半纤维素含量的升高(Fig 5k-n)。因此,PtoARF8可能是杨树次生细胞壁生物合成的积极调节剂。
Fig 6a-b
通过定位分析发现,PtoARF8定位于细胞核(Fig 6a),与其在转录调控中的作用一致。为了确定PtoARF8的全基因组结合位点,作者进行了DAP-seq,鉴定出4643个结合峰,其中18.68%定位于基因启动子区域(Fig 6b)
Fig 6d-f
通过DAP-seq鉴定到的PtoARF8结合峰和WGCNA的联合筛选,作者鉴定到许多与木材形成的经典基因与PtoARF8相关。Pearson相关分析显示,在成木组织中,PtoARF8与PtoCESA4、PtoGATL1、PtoUXT1呈正相关。此外,在PtoARF8-OE植物中,PtoCESA4、PtoGATL1和PtoUXT1基因的mRNA水平显著升高(Fig 6d-f)。
Fig 6g-n
进一步通过实验证实了PtoARF8激活了PtoUXT1、PtoGATL1和PtoCESA4的表达(Fig 6h, j, n)。综上所述这些发现表明,PtoARF8通过直接调控一系列细胞壁合成基因(如PtoUXT1、ptogat1和PtoCESA4),参与了次级细胞壁生物合成的调控。
总结
Fig 7
最后,作者提出了木材局部遗传调控网络(Fig 7),其中杂合性降低抑制了PtoARF8的表达,导致PtoCESA4、PtoGATL1和PtoUXT1表达的衰减,从而减少木材形成过程中纤维素和半纤维素的积累。
本文使用 文章同步助手 同步