来自nature genetics的一篇文章:Resequencing of 414 cultivated and wild watermelon accessions identifies selection for fruit quality traits
西瓜的果实特性很大程度上是人类选择的结果。在此,我们公布了一个改进的西瓜参考基因组和414份代表西瓜属所有现存物种的全基因组重测序数据。群体基因组分析揭示了西瓜属(Citrullus genus)的进化史,提示了饲用西瓜(Citrullus amarus)的独立进化和栽培西瓜(Citrullus lanatus)与黏籽西瓜(Citrullus mucosospermus)的亲缘关系。我们的研究结果表明,在物种形成、驯化和改良过程中,影响西瓜果实大小的不同位点受到选择。在甜西瓜的祖先中产生的一种非苦等位基因主要在栽培西瓜(C. lanatus)中被固定。果肉甜味的选择始于栽培西瓜(C. lanatus)的祖先,并持续通过现代育种技术选择控制棉子糖分解代谢和糖运输的位点。果肉的着色和糖分积累可能是通过包括糖转运蛋白基因在内的共有遗传成分共同进化的。本研究揭示了西瓜的物种形成和育种历史,并提供了宝贵的基因组资源。
西瓜(Citrullus lanatus, 2n = 2 = 22)是世界上最受欢迎的水果作物之一。它属于葫芦科(Cucurbitaceae)西瓜属(Citrullus genus),原产于非洲。西瓜的驯化历史已有4000多年,通过驯化和现代育种,西瓜从果小、果肉硬、颜色浅、味苦或味淡的野生西瓜,发展到果肉大、果肉甜、红、薄的现代甜西瓜。意大利艺术家乔瓦尼·斯坦奇(Giovanni Stanchi)在17世纪的一幅画作中捕捉到的一个西瓜果实,呈现出颜色不均匀的粉红色果肉、厚厚的果皮和许多深色的种子,这可能代表了驯化中的甜西瓜。现代甜西瓜育种主要关注果实的品质性状,如含糖量、果肉颜色和果皮形状等,从而导致甜西瓜的遗传基础狭窄。但自然和人类的选择是如何导致显著的表型改变并塑造了西瓜基因组,这在很大程度上仍是未知的。
西瓜属现存7个品种。罗典西瓜(Citrullus naudinianus)是唯一的雌雄异株及在形态上最独特的品种,通常发现于撒哈拉以南的非洲。缺须西瓜(Citrullus ecirrhosus)和热迷西瓜(Citrullus rehmii)适应沙漠环境,是非洲南部特有的植物。药西瓜(Citrullus colocynthis)因其药用及油籽特性而被种植,广泛分布于北非、西南和中亚。野生型饲用西瓜(Citrullus amarus)可以在非洲南部找到,栽培型西瓜种植在整个地中海地区,在那里它们被用作果酱和动物饲料,并作为水源。黏籽西瓜(Citrullus mucosospermus)主要作为种子食用和消费,现在分布在西非。此外,药西瓜(C. colocynthis)、饲用西瓜(C. amarus)和黏籽西瓜(C. mucosospermus)已被用于育种项目,以确定新的病虫害来源,来改良甜西瓜。
弱生殖障碍模糊了西瓜的品种分类,在以往的研究中,主要是基于有限数量的核和质体位点上存在的遗传多样性来阐明七个瓜类之间的关系。因此,高分辨率的基因组变异图谱对于更好地理解瓜类物种的进化和分化是至关重要的。在本研究中,我们首先利用PacBio 长读长并结合BioNano光学图谱和Hi-C染色质相互作用图谱,组装得到了改良版西瓜品种'97103’基因组序列。然后,我们对代表所有7 种现存西瓜属物种的414份西瓜种质的基因组进行了重测序,并对一些重要的水果品质性状进行了种群基因组分析和全基因组关联研究(GWAS)。我们的研究确定了一些与果实品质性状相关的候选位点,为现代甜西瓜的形成和驯化提供了见解。
结果
改良的西瓜参考基因组
西瓜品种‘97103’的基因组此前是利用Illumina公司的短读长技术组装的。为了提高其质量,我们使用PacBio 长读长,结合BioNano光学图谱和Hi-C染色质相互作用图谱,组装了新的“97103”基因组。总共产生了20.3 Gb的PacBio序列,N50长度为10.8 kb,覆盖了大约47.2层的西瓜基因组。PacBio组装得到总大小为359.8 Mb的基因组信息,包含367个contigs,其中N50的大小为2.3 Mb。总共生成了410.7 Gb clean BioNano 光学图谱数据,并从头组装到了BioNano光学图谱上,用于连接PacBio组装得到的contigs,由此获得149个scaffolds,N50大小为21.9 Mb,累计长度365.1 Mb。此外,Hi-C产生了约1.352亿条clean reads,其中大约9210万条reads (68.1%)被唯一地挂载到组装的基因组上,最后得到一组约6,950万有效read对,用于产生染色质相互作用信息(Supplementary Table 1)。利用Hi-C染色质相互作用图谱及结合之前发表的遗传图谱,进一步将scaffolds装配到染色体水平上。最后,将31个总大小为362.7 Mb(占总组装基因组的99.3%)的scaffolds组装成了11条染色体,每条染色体长度从27.1 Mb到37.9 Mb不等(Extended Data Figs. 1–3)。新组装的基因组与之前的97103基因组相比,彼此之间的共线性较高(Extended Data Fig. 4)。综合评价表明,新组装的基因组质量很高,与以前的相比有了很大的改进(Supplementary Note, Supplementary Tables 2,3 and Extended Data Figs. 5–7)。基因组上大约55.55%的序列被标注为重复序列,大大高于之前的版本(46.60%)(Supplementary Table 4),并且在组装的基因组上预测到22,596个高度可信的基因(Supplementary Note)。故97103基因组的改进为西瓜的研究和遗传改良提供了有力的参考。
西瓜属物种的基因组变异图谱及系统发育
本研究共从不同地理区域(Fig. 1a)收集到414份西瓜类资源进行基因组重测序分析,其中包括15份药西瓜(C. colocynthis), 31份饲用西瓜(C. amarus), 19份黏籽西瓜(C. mucosospermus), 345份栽培西瓜(C. lanatus) (258份栽培品种及87份地方品种),2份热迷西瓜(C. rehmii), 1份缺须西瓜(C. ecirrhosus)及1份罗典西瓜(C. naudinianus)(Supplementary Table 5)。这些资源的平均测序深度为14.5层,平均覆盖度为92.2%。共得到19725853个SNPs位点,其中位于编码区域的有1100803个,共产生502028个非同义突变及589735个同义突变,导致1031个起始密码子变化,及6808个终止密码子改变。此外,还鉴定得到6675290个小片段插入及缺失,其中56115个位于编码区。
使用在四倍简并(fourfold degenerate sites)位点上89914个SNP推断西瓜属种质之间的亲缘关系。西瓜属7个物种在系统发育树中的位置(Fig. 1b)与先前报道的基本一致,其中形态差异最大的西瓜属物种是罗典西瓜(C. naudinianus),是其他6个物种的姊妹,其次是药西瓜(C. colocynthis)和热迷西瓜(C. rehmii)。然而,缺须西瓜(C. ecirrhosus)与饲用西瓜(C. amarus)、黏籽西瓜(C. mucosospermus)和栽培西瓜(C. lanatus)亲缘关系较近,而不是像之前提出的那样与饲用西瓜(C. amarus)关系最密切。苏丹收集到的两份栽培西瓜(C. lanatus)资源(PI 481871和PI 254622)在系统发育上,属于栽培西瓜(C. lanatus)分支中最深的一支(Fig. 1b),这一结果支持了苏丹和非洲东北部邻国的原始西瓜可能与高糖栽培西瓜的祖先最为接近。其中,12份种质被聚在了未预料到的分支组别中,因此被排除在下游分析之外(Supplementary Table 5)。
从系统发育及群体结构推断得出,黏籽西瓜(C. mucosospermus)和栽培西瓜(C. lanatus)亲缘关系较为密切,且具有共同的祖先(Fig. 1b,c and Extended Data Fig. 8),表明它们衍生自同一祖先群体,且可能基于不同的目的发生驯化:一种用于食用种子,一种食用果肉。此外,黏籽西瓜(C. mucosospermus)和栽培西瓜(C. lanatus)之间的固定指数(fixation index FST)只有0.299,而饲用西瓜(C. amarus)与其他品种间两两固定指数在0.509到0.686之间(Extended Data Fig. 9)。且缺须西瓜(C. ecirrhosus)与黏籽西瓜(C. mucosospermus)之间存在基因流动(Fig. 1d),以及缺须西瓜(C. ecirrhosus)和饲用西瓜(C. amarus)之间也存在基因流动,而饲用西瓜(C. amarus)和黏籽西瓜(C. mucosospermus)之间没有显著的基因流动(Fig. 1d)。结合以前核糖体DNA染色体标记显示的饲用西瓜(C. amarus)和栽培西瓜(C. lanatus)的基因组组织差异的发现及从饲用西瓜(C. amarus)和栽培西瓜(C. lanatus)杂交所衍生的遗传群体产生的非孟德尔分离,表明,饲用西瓜(C. amarus)和包括黏籽西瓜(C. mucosospermus)和栽培西瓜(C. lanatus)在内的谱系可能来自于不同的祖先群体,或在分化后独立进化而来。
对多份种质中的4个西瓜属物种的核苷酸多样性(π)进行了评估。其中药西瓜(C. colocynthis)(π=6.75×10-3)和饲用西瓜(C. amarus)(π=2.28×10-3)的核苷酸多样性较黏籽西瓜(C. mucosospermus)(π=0.792×10-3)、栽培西瓜(C. lanatus)(π=0.56×10-3)及地方品种π=0.548×10-3)大得多。这表明,药西瓜(C. colocynthis)和饲用西瓜(C. amarus)与栽培西瓜(C. lanatus)的杂交是扩大西瓜遗传改良基础的宝贵资源。连锁不平衡(LD)的衰减率最高的是药西瓜(C. colocynthis)和饲用西瓜(C. amarus),其次是黏籽西瓜(C. mucosospermus)和地方品种,最低的是栽培品种(Extended Data Fig. 10),这与核苷酸多样性水平相关。在高糖西瓜品种中,LD的延伸幅度大于地方品种,这表明在高糖西瓜改良过程中可能存在瓶颈。
GWAS
单基分辨率下的变异图谱赋予了西瓜7个重要品质性状的GWAS(Supplementary Table 6)。共鉴定得到43个关联信号,其中8个与之前鉴定的QTLs重叠。在之前报道的QTL(QBRX2-1)中,发现了一个与果肉甜度(通过可溶性固体含量(SSC)测量)密切相关的峰。该峰含有糖转运基因ClTST2 (Cla97C02G036390,Fig. 2a)。在10号染色体上还发现了两个与果肉甜度密切相关的区域(Fig. 2b),这与之前的GWAS和QTL研究结果一致。这两个区域分别含有蔗糖合酶基因Cla97C10G194010和棉子糖合酶基因Cla97C10G196740,分别参与了蔗糖和棉子糖的合成,是西瓜束状韧皮部组织运输的主要代谢物。在2号染色体和4号染色体上检测到两种与果肉颜色显著相关的信号(Fig. 2c),其中4号染色体上的信号与果肉颜色相关的QTL区段(FC4.1)重叠,这一区段上包含一个番茄红素β-cyclase(环化酶)基因(LCYB Cla97C04G070940)。共检测到14个与果实形状相关的信号,其中以ClFS1 (Cla97C03G066390)基因附近信号最强,该基因控制果实伸长,与果形QTLs Qfsi3、FSI3.1、FSI3.2区段重叠(Fig. 2d)。在4号、6号和8号染色体上分别发现了三个与果皮颜色和果皮条纹高度相关的峰,分别对应于果皮性状位点、Dgo、S和D(Fig. 2e****,f)。这些峰中的候选基因包括Cla97C08G161570,它编码了光系统I中2-phytyl-1,4-萘醌甲基转移酶,该酶是将2-phytyl-1,4-萘醌醇转化为叶绿基甲萘醌所必需的,Cla97C04G068530,编码参与叶绿素合成的镁螯合酶(magnesium-chelatase)H亚基。在wd40重复基因Cla97C06G126710中发现了与果皮条纹相关的最强信号。共发现13个区域与种皮颜色相关(Fig. 2g)。在3号染色体上关联性最强的SNP与种皮颜色QTL qrc-c8-1区段重叠,且位于Cla97C03G057100基因上,该基因编码一种多酚氧化酶,可聚合邻苯醌(o-quinones)产生黑色、棕色或红色色素。
然后,我们使用之前西瓜果实发育期间的RNA测序(RNA-seq)数据,研究了这些候选基因在‘97103’果肉和果皮中的表达情况,及野生西瓜-饲用西瓜(C. amarus)‘PI 296341-FR’果肉中的表达。除了与种皮颜色相关的Cla97C03G057100,其他所有基因均在果肉和果皮中大量表达,而那些与果肉甜味相关的基因则在‘97103’的果肉中比在‘PI 296341-FR’中的表达水平要高得多,进一步证明了它们在这些果实品质性状中的潜在作用(Supplementary Table 7)。
果实品质性状的进化与驯化
为了研究环境和人工选择是如何形成瓜类基因组的,我们在西瓜基因组中寻找具有选择的特征位点。黏籽西瓜(C. mucosospermus)与栽培西瓜(C. lanatus)的亲缘关系最近。尽管黏籽西瓜(C. mucosospermus)被驯化为以食用种子为主,但其果肉的甜度和色泽等特性尚未经过人工的选择。因此,本研究以黏籽西瓜(C. mucosospermus)为研究对象,探讨了栽培西瓜(C. lanatus)的起源。首次将黏籽西瓜(C. mucosospermus)与药西瓜(C. colocynthis)进行比较,以揭示从药西瓜(C. colocynthis)到黏籽西瓜(C. mucosospermus)在物种形成过程中受到选择的基因组区域(referred to hereafter as speciation sweeps)。在黏籽西瓜(C. mucosospermus)中共鉴定得到172个清除位点,涉及14.0 Mb区段和416个基因(Fig. 3a, Supplementary Fig. 1 and Supplementary Tables 8,9)。然后将黏籽西瓜(C. mucosospermus)与栽培西瓜(C. lanatus)地方品种进行比较,以鉴定与驯化相关性状相关联的选择性清除位点(domestication sweeps)。共检测到151个驯化清除位点,累计大小为24.8 Mb(包含771个基因)(Fig. 3b, Supplementary Fig. 2 and Supplementary Tables 10,11)。通过现代栽培西瓜(C. lanatus)与地方品种的比较,共鉴定了与高甜西瓜改良(improvement sweeps)相关的125个选择清除位点(包含17.2 Mb和667个基因)(Fig. 3c, Supplementary Fig. 3 and Supplementary Tables 12,13)。在选择清除位点中,共620个基因是在高甜西瓜改良过程中所特有的(Supplementary Fig. 4)。这些改良特异性基因丰富的生物学过程包括葡萄糖导入和细胞壁修饰(Supplementary Table 14)。
果实大小
可收获植物器官的大小是农民在保存和传播种子时最重要的特征之一。本研究中,药西瓜(C. colocynthis)的平均果重约为0.21 kg。相比之下,饲用西瓜(C. amarus)、黏籽西瓜(C. mucosospermus)和栽培西瓜(C. lanatus)地方种和栽培品种会产生较大的果实,平均果重分别约为3.3、1.7、3.7和3.4 kg(Supplementary Fig. 5)。前期使用隔离群体鉴定到与西瓜果重相关的QTL区段,Qfwt2-1,Qfwt2-2-2,Qfwt3,Qfwt5-1和Qfwt5-2。然而,这些位点是否在物种形成、驯化或改良过程中促进了西瓜果实的尺寸增大,目前尚不清楚。
Qfwt2-1和Qfwt3与物种形成和驯化清除位点重叠(Fig. 3a,b)。另一个果重QTL, Qfwt5-1,仅在西瓜改良过程中被选择(Fig. 3c)。在驯化或改良的清除位点中未发现Qfwt2-2和Qfwt5-2,表明它们有可能在未来改善高甜西瓜果实的大小。
饲用西瓜(C. amarus)果实比药西瓜(C. colocynthis)大,说明饲用西瓜(C. amarus)从黏籽西瓜(C. mucosospermus)和栽培西瓜(C. lanatus)的祖先中分离出来后,果实也增大了。在药西瓜(C. colocynthis)和饲用西瓜(C. amarus)之间检测到的选择性清除中,有三个区域与Qfwt2-1和Qfwt3重叠(Fig. 3d),这说明了它们在不同瓜类中对果实大小的控制和这些位点的平行进化的重要性。
果实风味
非苦味果实的选择可能发生在高甜西瓜驯化初期。在374份西瓜属资源的果肉苦味鉴定中,9份药西瓜(C. colocynthis)和25份饲用西瓜(C. amarus)均有苦味,而16份黏籽西瓜(C. mucosospermus)中的12份和所有324份栽培西瓜(C. lanatus)地方品种和栽培种均无苦味(Supplementary Fig. 6)。之前鉴定的苦味相关的QTL(qbt-c1-1)中含有ClBt基因(Cla97C01G003400),该基因编码一种BHLH(basic helix-loop-helix)转录因子,与黄瓜苦味调节基因CsBt和CsBl同源。ClBt附近的基因组区域在栽培西瓜(C. lanatus)地方品种和黏籽西瓜(C. mucosospermus)之间高度分化(Supplementary Fig. 7),且黏籽西瓜(C. mucosospermus)的遗传多样性明显高于栽培西瓜(C. lanatus)地方品种(Supplementary Fig. 8)。导致ClBt的提前终止的SNP位点与非苦味相关(Chr01:3,216,322C to T)。带有苦味果实的所有药西瓜(C. colocynthis)、饲用西瓜(C. amarus)和黏籽西瓜(C. mucosospermus)均含有纯和苦味等位基因(C),而在12份非苦的黏籽西瓜(C. mucosospermus)及所有的栽培西瓜(C. lanatus)中均发现了纯和的非苦等位基因(T),表明该非苦味等位基因起源于栽培西瓜(C. lanatus)的祖先,并固定在高甜西瓜中。有趣的是,在果肉和果皮中没有检测到ClBt的表达(Supplementary Table 15)。通过对西瓜基因组数据库中公开的RNA-Seq数据的研究发现,ClBt仅在叶片中表达,而在花、果、种子或根组织中不表达,说明ClBt调节西瓜果实苦味的机制可能是复杂的。
提高果肉甜度是现代西瓜育种的一个重要课题。药西瓜(C. colocynthis)、黏籽西瓜(C. mucosospermus)和栽培西瓜(C. lanatus)地方品种和栽培种的平均SSC分别为1.6、3.4、8.3和10.1°Brix(Supplementary Fig. 9)。除蔗糖外,水苏糖和棉子糖是葫芦科植物中主要的转运糖,水苏糖、棉子糖到达果实中,由α-galactosidases(半乳糖苷酶)迅速代谢为二糖和单糖。
药西瓜(C. colocynthis)果实中双糖和单糖含量较低,但有丰富的棉子糖和水苏糖,而栽培西瓜(C. lanatus)果实则相反(Supplementary Fig. 10)。一个碱性的α-galactosidases(半乳糖苷酶)基因Cla97C04G070460 (ClAGA2),与甜瓜CmAGA2同源,被发现在一个药西瓜(C. colocynthis)与黏籽西瓜(C. mucosospermus)和栽培西瓜(C. lanatus)相比核苷酸多样性大大减少的基因组区间(Supplementary Fig. 11)。在果实发育过程中,ClAGA2在‘97103’果肉中的表达显著增加,远高于‘97103’果皮和‘PI 296341-FR’果肉中的表达(Supplementary Fig. 12a)。为了在功能上证实ClAGA2在果肉糖份积累中的作用,我们使用CRISPR-Cas9系统,产生了栽培西瓜(C. lanatus)ClAGA2突变的株系(Supplementary Fig. 12d)。突变体显著降低了果肉中可溶性糖、葡萄糖、果糖和蔗糖的含量,但增加了棉子糖的含量(补充图12d)。这些结果均表明,ClAGA2通过促进棉子糖向葡萄糖、果糖和蔗糖的代谢,从而导致了西瓜果肉中糖份的积累,并可能在高甜西瓜祖先的早期就已经被选择,正如黏籽西瓜(C. mucosospermus)遗传多样性的降低一般。
Qfru2-3、QBRX2-1和QBrix6的QTL是已知控制果实含糖量的,这些区段与驯化清除区间相重叠(Fig. 3b)。根据所鉴定的改良清除区段,QBRX2-1在现代品种的育种中也被选择,而QBrix6可能只在驯化过程中被选择(Fig. 3c and Supplementary Table 15)。此外,在改良清除位点中发现了控制甜味的位点FCE10.1(Fig. 3c)。在这些和其他清除位点中发现了几个与水果质量相关的基因,表明它们对栽培西瓜果实的芳香风味、质地和营养特性有潜在的贡献(Supplementary Note)。
果肉颜色
与野生和原始西瓜不同的是,高甜西瓜在成熟时果肉中会产生丰富的类胡萝卜素,并在成熟过程中积累在有色体中,形成红、橙、黄等不同的果肉颜色。八氢番茄红素合成酶(PSY)是胡萝卜素合成途径中的第一个限速酶,它决定了类胡萝卜素库的大小。在果肉颜色QTL(qFC.1)中的一个PSY1基因Cla97C01G008760在果肉中高表达,且其表达水平与果实成熟过程中番茄红素的积累呈正相关(Supplementary Fig. 13a)。Cla97C01G008760位于栽培西瓜(C. lanatus)地方品种和黏籽西瓜(C. mucosospermus)基因组的一个高度分化的区域(Supplementary Figs. 7,13b)。这些结果表明,PSY1表达的调控可能通过增加甜西瓜成熟果实中类胡萝卜素的含量,促使果肉从浅色向红色、橙色或黄色过渡。
我们通过GWAS分析,在4号染色体上发现了一个较强的与果肉颜色相关的信号,它包含了LCYB基因Cla97C04G070940(Fig. 2c)。而与之关联最密切的SNP (Chr04:15442987)位于LCYB上,并导致氨基酸从保守的苯丙氨酸转变为缬氨酸(F226V)。所有209个红肉或粉红肉栽培西瓜(C. lanatus)在LCYB上均均有F226V置换,而14个橙肉和20个黄肉的栽培西瓜(C. lanatus)种和所有的药西瓜(C. colocynthis)、饲用西瓜(C. amarus)和黏籽西瓜(C. mucosospermus)种均具有野生型等位基因。这些结果表明,LCYB中可能导致番茄红素的积累这一突变在高甜西瓜中被选中,并在很大程度上固定在高甜西瓜中,导致大多数现代西瓜品种的果肉呈红色。
在2号染色体上一个与甜度相关的QTL(QBRX2-1)上发现了第二个与果肉颜色相关的信号(Fig. 2c);该QTL上含有候选基因ClTST2,当该基因过表达时,会导致果实中糖含量升高,并导致果肉颜色的变化。有研究表明,糖水平升高会激活西瓜果实中定位于有色体的磷酸转运蛋白ClPHT4;2 (Cla97C10G205070),这对于类胡萝卜素在果肉中的积累是必需的。在驯化和改良过程中,甜味QTL(QBRX2-1)中糖转运蛋白基因ClTST2受到选择(Fig. 3b,c),该基因可能通过磷酸转运蛋白ClPHT4;2来增加果肉中糖含量,从而促进类胡萝卜素的积累。综上所述,这些结果表明,控制果肉颜色和增加甜度这两个高度相关的性状(Supplementary Fig. 14)可能通过共有的遗传组分相互关联。
饲用西瓜(C. amarus)的抗性进化与栽培西瓜(C. lanatus)中的基因渐渗**
现代高甜西瓜易感染多种疾病和害虫。饲用西瓜(C. amarus)在西瓜育种中已被用作抗枯萎病、白粉病和线虫以及耐旱的基因来源。为了研究饲用西瓜(C. amarus)在进化过程中基因组的变化,这可能是其具有抗病能力的基础,我们从药西瓜(C. colocynthis)寻找饲用西瓜(C. amarus)的受选择特征,并鉴定得到151个选择性清除位点,覆盖基因组10.9Mb区域及包含364个基因(Fig. 3d, Supplementary Fig. 15 and Supplementary Tables 16,17)。在这些选择性清除位点中,包含146个基因的71个选择性清除位点是饲用西瓜(C. amarus)所独有的,在药西瓜(C. colocynthis)和黏籽西瓜(C. mucosospermus)的物种形成过程中是没有被选择的,这其中包括4个编码受体类激酶的基因(Supplementary Table 18)。值得注意的是,镰孢菌属1型抗性位点Fo-1.3和镰孢菌属2型抗性位点qFon2-2与这些特异的选择清除位点有重叠。
含有从野生亲缘中的有益等位基因的渗入,对栽培作物的改良具有促进作用。我们在6号染色体上发现了一个由饲用西瓜(C. amarus)向栽培西瓜(C. lanatus)约28.3-29.3 Mb区段的基因渐渗(Supplementary Fig. 16a),包含136个基因,包括编码乙酰乳酸合成酶、紫色酸性磷酸酶、钙结合蛋白、乙二醛氧化酶和受体类蛋白激酶等基因,其在白粉病耐缺氧或耐低磷条件下可能起作用(Supplementary Table 19)。此外,在4号染色体9.66-10.32 Mb区段,发现了一个从药西瓜(C. colocynthis)向栽培西瓜(C. lanatus)的基因组渐渗(Supplementary Fig. 16b),该区域与镰孢菌属1型抗性位点QTL(Fo-1.4)重叠。这些结果表明,与抗病相关的药西瓜(C. colocynthis)和饲用西瓜(C. amarus)的基因组区域可能已经被选择用于优良西瓜品种的改良。
讨论
改良后的西瓜‘97103’参考基因组和414份重测序,使我们能够捕获现存的7个西瓜属物种的遗传变异,并重建它们的分化历史。利用GWAS,确定了与关键果实品质性状相关的基因组区域,为西瓜育种和进一步确定因果关系提供了有用的信息。揭示了高甜西瓜基因组在物种形成、驯化和西瓜改良中的选择性特征,而果实性状的改变在物种形成和驯化后更为重要(Fig. 4)。高甜西瓜的祖先可能产生小而苦涩的果实,这在现存野生西瓜药西瓜(C. colocynthis)中可以看到。由图4可以看出,无论是栽培西瓜(C. lanatus)、黏籽西瓜(C. mucosospermus)还是饲用西瓜(C. amarus),其果实大小都增大了,这涉及到不同但重叠的QTLs区域。果肉苦味是野生西瓜的一种保护性性状,但对人类而言却是不受欢迎的,故在驯化过程中被筛选出来并加以抑制。随着果肉苦味的消失,西瓜地方品种的果实变甜了。在高甜西瓜的祖先中,正在选择碱性α-半乳糖苷酶ClAGA2,该碱性α-半乳糖苷酶ClAGA2在西瓜果实库中的水苏糖和棉子糖的韧皮部卸载以及这些寡糖的快速代谢中起作用,为提高果肉中可溶性糖含量提供了重要的前提条件。在驯化和改良过程中,糖转运蛋白ClTST2均被选择,促进了果肉细胞液泡中糖的积累。高甜西瓜果肉着色是在驯化过程中通过关键的生物合成酶PSY来扩大总类胡萝卜素库,再通过ClTST2间接增加类胡萝卜素的积累来实现的。通过维持番茄红素代谢酶LCYB中一个氨基酸的替换,红色果肉在以后的高田西瓜中被选择。糖转运蛋白ClTST2导致糖积累的潜在双重职能和果肉颜色可能为人类选择提供了一个方便可行的目标,尤其是在突变LCYB兴起和番茄红素成为占主导地位的类胡萝卜素,因为强烈的红色的可以作为甜味一个简单的指标。总的来说,我们的发现为西瓜的进化和驯化历史提供了重要的线索,并揭示了高甜西瓜果实品质性状形成的基因组基础。本研究的资源为未来的种质利用和西瓜改良提供了一个基因组架构。
补充:
selective sweep说的意思就是由于某一位点受到强选择后,其周围的位点的多态性因受改位点牵连而发生多态性降低的现象。
四倍简并位点(fourfold degenerate site)
如果密码子的某个位点上任何核苷酸都编码同样的氨基酸,则称这个位点为4倍简并位点。例如甘氨酸密码子(GGA, GGG, GGC, GGU)的第三个位点就是一个4倍简并位点,因为这个位点上所有的核苷酸替换(无论是A、G、U、C)都是同义的,即编码同一个氨基酸。只有某些密码子的第三个位点可能是4倍简并位点。
参考:
Guo, S., Zhao, S., Sun, H. et al. Resequencing of 414 cultivated and wild watermelon accessions identifies selection for fruit quality traits. Nat Genet 51, 1616–1623 (2019). https://doi.org/10.1038/s41588-019-0518-4