文献
2023
Molecular Plant
Comparative and population genomics of buckwheat species reveal key determinants of flavor and fertility
课题背景
(1)荞麦属于蓼科(Polygonaceae)荞麦属,分布在世界各地,种植历史超过4000年。普通荞麦 (Fagopyrum esculentum)和苦荞 (F. tataricum)在分布、形态以及营养价值等方面存在显著差异。普通荞麦广泛分布在温带地区,包括欧亚大陆、北美、南非和大洋洲,而苦荞主要分布在寒冷气候区,包括高海拔地区。苦荞是自交亲和的,而普通荞麦不具备自交亲和性,其花有两种形态,即短柱花和长柱花。不同形态的花可以进行异交授粉,而具有相同形态的花则不能,这导致与苦荞相比,普通荞麦的产量更低。普通荞麦的花型由包含S-ELF3基因的S-locus 决定,这一基因的完整序列仅存在于具有短柱花的植物中。
(2)由于其均衡的氨基酸组成、丰富的膳食纤维以及生物活性黄酮类化合物,荞麦被视为均衡饮食中的重要组成部分。芦丁(Rutin)占荞麦黄酮类化合物的70%,一般认为在其他作物中不存在,这赋予了荞麦独特的药用特性,如维持血管毛细管的正常弹性和/或预防高血压和糖尿病。与苦荞相比,普通荞麦中的芦丁、山奈酚和槲皮素等多种黄酮类化合物含量明显较低。但是芦丁在水解时会产生强烈的苦味,普通荞麦通常被认为是一种更美味的替代品。普通荞麦低苦味、高营养价值、不含麸质、分布广泛以及用途多样,使其成为全球重要的作物。
(3)之前的研究已经成功组装了苦荞的参考基因组(489.3Mb),以此为参考基因组,对510份苦荞进行全基因组重测序,揭示了全面的苦荞基因组变异信息。
亮点
F. esculentum var. homotropicum(后面简写为Homo)是研究普通荞麦的重要模型。作者第一次组装了Homo的高质量参考基因组。
通过与苦荞进行比较,系统的揭示了普通荞麦比苦荞具有更广泛的环境适应和更好的风味的遗传基础。
基于572份普通荞麦的重测序数据,研究了普通荞麦中与环境适应相关的基因。通过全基因组关联分析,鉴定到与产量、风味和开花特性相关的候选基因。
结论1 Homo基因组组装及注释
Fig 1a-e
基于K-mer评估,Homo基因组大小为1.33 Gb,杂合度较低(0.05%),重复序列含量很高。作者利用45.83 Gb PacBio HiFi long reads, 151.98 Gb Illumina short reads和 200.82 Gb Hi-C 数据对Homo(Fig 1a-e)基因组进行了组装,contig和scaffold N50别为53.43 Mb和158.30 Mb。BUSCO评估显示,96%的保守同源基因是完整的,只有4%的同源基因出现片段化或缺失。
Fig S3
共注释出38704个蛋白编码基因,平均基因长度3232bp,CDS长度为1248bp。重复序列长度为997.14Mb,占全基因组的80.53%,其中LTR-RTs是最丰富的类型。LTR-RTs主要位于基因间区,其中12.52%位于基因附近或者外显子/内含子内(Fig S3a)。相对而言,苦荞的LTR-RTs只有189.33Mb,近期的LTR-RTs的插入使得Homo基因组更大(Fig S3b)。
结论2 普通荞麦和苦荞的比较基因组分析
Fig 2a-b
为了研究荞麦基因组的系统发育,作者从两种单子叶植物和13种双子叶植物中识别了39,422个orthogroups,并基于889个单拷贝orthogroup进行了系统发育分析(Fig 2a)。系统发育树显示, Tartary buckwheat (苦荞)和 golden buckwheat与普通荞麦之间的亲缘关系更近,与之前的研究一致。在Homo中鉴定到590个扩张的orthogroups和346和收缩的orthogroups,主要涉及光合作用、萜类合成、氨基酸合成等功能,这可能与栽培荞麦的进化有关。
为了进一步探索荞麦的分化,作者分析了全基因组复制事件。Homo和Tartary buckwheat内同源基因对的Ks分布显示,在Ks=0.88 处有一个共同的峰值(Fig 2b),这表明大约在6770万年前发生了一次共同的WGD。基于Homo和Tartary buckwheat之间同源基因对的Ks峰值(Ks=0.12),估计这两个物种的分化大约在920万年前发生(Fig 2b),接近于基于MCMCTREE方法得到的分化时间(Fig 2a)。
Fig 2c-d
作者进一步对Homo 和 Tartary buckwheat的基因组进行了共线性分析,共鉴定得到86个同源区块(Fig 2c-d)。作者还鉴定出了七个大的inversion 区块,这些区块中的基因与金属离子的应答、毒素代谢过程和次生代谢产物降解过程相关,这些基因可能促进了两个物种对环境适应能力的分化。
Fig 2e
作者分析了Homo 和 Tartary buckwheat中的转录因子家族,发现相对于Tartary buckwheat,Homo基因组中的FAR1转录因子明显更多(148 vs 25)。之前的研究表明FAR1基因在植物光响应中起关键作用,作者推测FAR1基因在普通荞麦中更多有助于增强其环境耐受性。
结论3 普通荞麦和苦荞黄酮类化合物的差异
Fig 3a-b
黄酮类化合物尤其是芦丁的含量是造成苦荞苦味的原因。为了量化Homo 和 Tartary buckwheat之间的代谢差异,作者对两者的种子进行了代谢组学分析。作者共鉴定到1048种被注释的代谢物,其中503种代谢物的丰度在两者之前存在显著的差异(Fig 3a)。这些差异代谢物涉及黄酮类化合物、黄烷醇等(Fig 3b)。
Fig 3c-d
在存在丰度差异的黄酮类化合物中,有58种在Tartary buckwheat中显著更丰富,其中包括槲皮素、山奈酚、异槲皮素、芦丁、花叶耳草苷、水仙花苷、柚皮苷和槲皮醇-3-O-鼠李糖苷(Fig 3c)。
为了阐明Homo中芦丁含量较低的遗传基础,作者重点分析了UDP-葡萄糖基转移酶(UGTs),这些酶参与了鼠李糖的生物合成途径的最后两个步骤。在Homo和苦荞麦中分别找到了9个和12个鼠李糖基转移酶(RTs)基因,这些基因编码了鼠李糖的合成最后一步中的酶(Fig 3d)。此外,β-葡萄糖苷酶(BGLU)负责降解鼠李糖苷,在苦荞加工时会产生苦味。编码BGLU的鼠李糖降解酶基因(RDEs)数量在Homo中为6,在苦荞麦中为9(Fig 3d)。
Fig 3e
因此,Homo中鼠李糖的合成基因家族(FLS和RT)成员更少可能在减少Homo中鼠李糖的积累中发挥作用,而较少的鼠李糖水解基因家族(RDE)可能解释了普通荞麦相对于苦荞具有较少苦味。
在荞麦中,黄酮类化合物在花和叶子中比在根和种子中更丰富,这可能是由于黄酮类化合物生物合成基因的差异表达所致。作者通过对不同Homo组织进行转录组测序,发现FhFLSs、FhRTs和FhRDEs基因的表达呈现明显的组织特异性(Fig 3e)。大多数FhFLS(2/3)和FhRT(6/9)基因在花中高表达(Fig 3e),这有助于在荞麦花器官中黄酮类化合物的积累。
结论4 普通荞麦的群体结构反映了对环境的适应性
Fig 4a-c
栽培荞麦从中国被驯化,为了研究普通荞麦的进化历史,作者收集了来自33个国家的572份普通荞麦材料(Fig 4a),对这些材料进行了10×的重测序,共鉴定到24,847,225个SNPs。
系统发育分析将所有材料分成两个分支,第一支包括来自中国以外的169份材料和少数中国材料,第二支包括403份中国材料。主成分分析和STURCTURE分析进一步支持了这一分类(Fig 4b-c)。来自中国以外地区的样本是来自中国群体I的一个小亚种,而不是来自群体II,而后者可能包括了未开发的育种材料。经CV error 确定,最佳K值为2,当K=3或4时,群体I的样本仍然主要分为两个簇(Fig 4C)。这可能是由于普通荞麦的异交以及中国内部常见的种质交流所导致的。
Fig 4d-e
作者检测了群体Ⅰ和群体Ⅱ之间的群体分化,鉴定到339个区域存在明显的群体分化(群体分化指数前1%),包含1637个基因(Fig 4d)。这些基因的功能涉及花器官发育、代谢过程调控、胚胎发育和种子休眠等。
在这些区域,作者还鉴定到两个转录因子NF-Y和B3P,它们在两个群体中处于正选择状态。NF-Y在植物生长、花器官发育和耐旱性方面发挥多种关键作用。B3P对于应对长时间的低温处理并通过直接激活SOC1和FT来促进开花至关重要。基于此,作者推测,普通荞麦的种内进化中可能发生了花期和抗逆性的性状分化。
结论5 普通荞麦中环境适应及类黄酮合成基因的鉴定
Fig 5a-e
作者对主要性状进行了全基因组关联分析。有五个GWAS信号与主茎数MSN、成熟期MD和花期FB相关(Fig 4d-4h)。它们在拟南芥中的同源基因主要与植物生长发育及抗逆相关。
Fh05G014970基因编码一种蛋白磷酸酶抑制剂,与花期存在显著关联(Fig 5a)。Fh05G014970中鉴定出两种等位基因,携带T和T/C等位基因(n = 154)的植物具有显著较长的花期,而携带C等位基因的植物(n = 6)具有较短的花期(Fig 5b)。这个非同义SNP(T/C)导致丝氨酸向天冬氨酸的转变(Fig 5c),可能影响了蛋白质功能。因此作者认为,Fh05G014970可能在控制开花时间中发挥关键作用。
芦丁含量RC的GWAS共鉴定到17个显著关联的基因组区域,包含了68个候选基因(Fig 5d)。6号染色体上的一个基因(Fh06G015130),在群体I和群体Ⅱ之间的选择性扫描中也被鉴定出来(附图16和附表31)。根据外显子中的一个SNP,鉴定出了两个等位基因(GG-CC)和它们的杂合子(G/C)。具有G等位基因的植物的芦丁含量明显高于具有C等位基因的植物,而杂合子的芦丁含量介于两者之间(Fig 5e)。这种非同义的SNP导致了天冬氨酸向组氨酸的转变,可能影响了蛋白质之间的互作。该基因在拟南芥中的同源基因可以直接与JRE基序结合,调控植物的次生代谢。
Fig 5f-i
Fh04G007350和Fh03G002630基因编码芦丁生物合成后两步的两个关键酶(F3GT和RT),在其启动子中分别具有一个和两个JRE基序,暗示Fh06G015130可能与两者的启动子结合。通过EMSA进一步证实了Fh06G015130与F3GT和RT启动子的结合(Fig 5f-g)。
此外,作者在普通荞麦根中过表达了Fh06G015130,发现芦丁的含量均显著降低,而它们的上游前体物质,如槲酮、二氢槲酮和柚皮素的含量与野生型相比显著增加(Fig 5i),表明Fh06G015130与芦丁的合成存在某种联系。在过表达Fh06G015130的根系中,F3GT和RT的表达量下降(Fig 5H)。
在对芦丁含量进行的GWAS分析中,作者还鉴定出一个ABC转运体G家族基因(Fh03g007120),该基因被推测参与多种化合物的转运,因此作者推测该基因也在芦丁的生物合成过程发挥重要作用。以上这些候选基因和遗传位点都有可能用于提高普通荞麦的品质和产量。
结论6 荞麦的育性研究
Fig 6a-c
普通荞麦往往是自交不亲和的(Fig 6a),这导致其结实率和单产较低。然而,Homo是自交亲和的,是荞麦育种材料的理想选择。为了鉴定与自交不亲和相关的基因,作者对花形态进行了全基因组关联分析,在Chr2上发现一个强信号(Fig 6b)。该区域与普通荞麦候选S位点区域重叠,被命名为Sh位点(Fig 6c)。
Fig 6d-g
据报道,Sh位点上的S-ELF3基因与花柱长度相关,但是在homo的该位点并没有发现该基因,作者检查并派出了基因组组装造成的错误。重新检查GWAS信号,作者在Chr4上定位了到homo的FhS-ELF3基因,发现在homo中该基因编码存在大片段缺失,这可能导致了花形态的改变(Fig 6d-f)。
为了研究荞麦属中柱头形态的系统发育关系,作者构建了S-ELF3基因的系统发育关系(Fig 6g),这些荞麦物种明显被分成两组(Cymosum和Urophyllum),与预期一致。然而,与众所周知的F. dibotrys 和 F. tataricum 之间更近的亲缘关系不同,FdS-ELF3显示出与FeS-ELF3和FhS-ELF3更近的关系。这可能反映出苦荞在柱头形态和生育力等方面经历了更多的选择压,导致基因树和物种树的拓扑结构存在差异。
本文使用 文章同步助手 同步