今天分享一篇来自nature communications的文章:The genetic basis of sex determination in grapes
Massonnet, M., Cochetel, N., Minio, A. et al. The genetic basis of sex determination in grapes. Nat Commun 11, 2902 (2020). https://doi.org/10.1038/s41467-020-16700-z
Abstract
对于植物性别分化基因及突变的鉴定至今仍然是一个重大挑战。在此,本文研究了葡萄物种中性别决定区域(SDR)的结构和演化。并报道了一个改进的、染色体级别的赤霞珠(Cabernet Sauvignon)葡萄的基因组序列信息及逐步组装了9个野生和栽培葡萄的基因组。通过解析20个葡萄品种的SDR单倍型,我们比较了雄性、雌性和雌雄同体的单倍型结构,并确定了性别决定相关区域。结合基因表达数据,我们确定了VviINP1基因中的一个候选雄性不育突变,以及与转录因子VviYABBY3相关的潜在雌性不育功能。数据表明,在雌雄同体单倍型之间很少发生重组事件,导致雌雄异株在驯化过程中丢失。这项工作显著地促进了对葡萄性别决定遗传基础的理解,并提供了在葡萄育种计划中快速鉴定性别类型所必需的信息。
Introduction
植物具有多种交配系统。有些是雌雄同株异花的,在同一株植物上有单独的雄花和雌花;还有一些是雌雄同体的,有两性花。有时植物具有单独的雄性和雌性个体,这种交配系统称为雌雄异株。雌雄异株需要保证异交,但这只发生在5-6%的被子植物中。尽管雌雄异株比较罕见,但它在系统发育上是广泛存在的,表明它在多种情况下都是独立进化的。
由于雌雄异株的多种进化起源和一些重要的经济作物具有雌雄异株的特性,因此雌雄异株一直是众多进化和遗传研究的焦点。关于雌雄异株起源的一个常见的假设是双基因座模型,该模型要求雌雄异株从一个雌雄同体的祖先分两步演化而来。第一步包括阻断雄性性别决定功能的隐形突变。具有纯合雄性不育突变的个体只保留雌性功能,而具有这种突变的种群中既有雌性也有雌雄同株的个体。第二步需要一个显性突变来抑制雌性的功能,从而产生雄性。这种双基因座系统只有在两个基因座完全连锁的情况下才能保持雌雄分离,因为它们之间的重组可以恢复雌雄同体。对包括木瓜(Carica papaya)、草莓(Fragaria virginiana)、白花蝇子草(Silene latifolia)、猕猴桃(Actinidia spp.)、葡萄(Vitis spp.)等物种的研究发现,支持了这一双基因座模型。然而,导致雌雄异株的不育突变尚未在任何物种中被完全鉴定出来。到目前为止,对于不育突变基因最可能的候选来自于对芦笋和猕猴桃的研究。例如,在芦笋中,雌性缺少一种与绒毡层发育相关的基因,而突变的雄性缺少一种假定的雌性抑制基因,因而无法恢复雌雄同体。
在此,我们研究了葡萄属的性别决定区域(SDR)。约有70种野生葡萄都是雌雄异株的,表明该属自起源以来,雌雄异株一直是保守的。栽培葡萄(Vitis vinifera ssp. vinifera; hereafter Vv vinifera),葡萄的一种,已恢复为雌雄同株,尽管其野生(Vitis vinifera ssp. sylvestris (hereafter Vv sylvestris))祖先是雌雄异株的。这种交配系统的转变发生在大约8000年前的驯化时期,可能是雄性(M)和雌性(F)单倍型之间发生了一次罕见的重组事件所导致的。因此,葡萄有三种类型的个体(Fig. 1a, b):(i)雌蕊减少的雄花,没有柱头或花柱发育;(ii)雌花含有反折的花药和能释放不育花粉粒的雄蕊;(iii)栽培葡萄中的雌雄同花个体,其具有完美的花朵,带有功能性的雌蕊和雄蕊,具有可育的花粉。这三种类型由SDR区域中的基因型决定。其中雄性类型为雄性和雌性单倍型(MF)的杂合子,雌性类型为纯合子(FF),以及栽培葡萄(Vv vinifera)的雌雄同花要么是雌雄同花单倍型(HH)的纯合子,要么是杂合子(HF)。
之前的遗传和基因组上的研究已经确定了葡萄中SDR的大致边界。在葡萄属中,SDR在遗传上映射到2号染色体上约150 kbp的区域,这其中包含15到20个基因。在野生葡萄(sylvestris Vv)中,该区域内的多态性具有高度的连锁不平衡,表明M和F单倍型之间存在很低或不存在重组。假设该区域包含由双基因座模型预测的隐性雄性不育等位基因和显性雌性不育等位基因,并且已通过基因表达比较分析尝试对其进行鉴定。其中一个候选基因,腺嘌呤磷酸核糖转移酶基因VviAPT3,在雄花的心皮原基中表达,表明其与雌蕊败育有关。
直到最近,葡萄的性别决定研究中,一个主要的限制是,栽培葡萄(Vv vinifera)的参考基因组仅代表部分组装的F单倍型。最近的研究解析了四种SDR单倍型的部分序列信息,包括三种H单倍型和一种F单倍型。然而,尽管在这方面取得了重大进展,但是由于缺乏M单倍型的信息,我们对SDR区域和性别决定因素的理解一直受到阻碍。
为了填补这一空白,我们逐步组装了包括雌雄同花栽培葡萄、雄株和雌株野生葡萄在内的9个二倍体基因组。所有这些基因组都是基于高覆盖率的PacBio长读长测序。对于每个基因组,手动校正了遗传定义的单倍型中SDR区域,并已在雄株、雌株和雌雄同花个体的花朵发育早期和晚期测定了从该区域表达的转录本。有了这些广泛的序列和表达数据,我们比较了F、H和M单倍型,以更好地定义SDR区域,确定候选的性别决定基因,并评估H单倍型是否源于重组事件。
Results
性别特异性单倍型在整个葡萄属中都是保守的
我们对8个葡萄品种的完整基因组进行了测序和组装,其中包括3个雌雄同花的栽培葡萄(Vv vinifera)品种(Merlot, Black Corinth seedless and Black Corinth seeded)、4个野生葡萄品种(sylvestris Vv)(两个雌株和两个雄株)、和一个(V. arizonica)雄株。此外,还对雄株圆叶葡萄(Muscadinia rotundifolia)的基因组进行了测序,并将其作为葡萄雌雄异株的外群(Fig. 1c)。每个基因组都是基于单分子实时 DNA 测序和 FALCON-Unzip从头组装,产生部分倍型的二倍体基因组。我们还使用了包括赤霞珠(Cabernet Sauvignon)和金粉黛(Zinfandel)两个可公开获得的基因组,并对这两个品种以相同的方法进行了测序和组装。所有的二倍体组合都是高度连续的,并且大约覆盖了预期单倍体基因组大小的两倍(Supplementary Data 1)。通过HiC染色质互作图谱、光学图谱和多种辅助组装手段进行辅助挂载和组装,赤霞珠(Cabernet Sauvignon)基因组的组装得到进一步改进,从而得到了全部19条染色体和两个阶段性拷贝hap1和hap2。
通过将性别连锁标记的引物与赤霞珠2号染色体阶段性拷贝hap1参考序列进行比对,首次鉴定了SDR区域。然后将赤霞珠hap1拷贝中SDR区域的蛋白质编码序列与其他10个基因组组装序列进行比对,以识别同源区域。接着,我们手工标注了每个基因组中每个单倍型的SDR区域,并根据已知的基因型(Fig. 1c)和已知的H vs. F单倍型结构来指定性别类型(M、F或H)。通过这些方法,我们解决了20个葡萄品种的SDR单倍型(5H、12F、3M 单倍型)和M. rotundifolia的M和F单倍型。
所有的SDR单倍型都与赤霞珠hap1拷贝H单倍型比对,以评估其结构差异并鉴定性别特异性特征(Fig. 2; Supplementary Fig. 1)。不同性别类型,其长度存在明显差异。单倍型大小在约171.6-837.4 kbp之间(Fig. 2a-c),但F单倍型(181.4 ± 10.2 kbp))明显短于M (425.9 ± 274.6 kbp;Mann-Whitney test, P value = 0.0008403)单倍型和H(289.2 ± 7.4 kbp; P value = 0.0002334)单倍型。这些长度差异反映了性连锁结构变异的存在(SVs; >50 bp)。例如,12个葡萄F单倍型与H单倍型赤霞珠相比,共有8个大的缺失,总长度为117.4 kbp(Fig. 2b)。这些与F单倍型连锁的大部分缺失(62.9%)由转座元件(TE)构成,包括 LTR、 Gypsy、 Copia 和 MuDR 元件。同样,相对于参考序列H单倍型,这3个M单倍型共享两个大SVs,包括在4,802,134处的22.6 kbp插入和在5,021,983到5,052,079处的30 kbp缺失。此外,V. arizonica 的M单倍型有一个独特的约400 kbp的插入,M. rotundifolia 的M单倍型包含的倒置涵盖了SDR区域的57%(Fig. 2a)。不同性别类型的SDR单倍型中基因含量不同。20个葡萄的SDR单倍型共有13个SDR基因,其中2个SVs的基因含量发生了变化。如前人观察的一致(Zhou et al),F单倍型具有与H单倍型和Vv sylvestris 的M单倍型相关的SV,该单倍型删除了两个编码TPR-containing蛋白的基因。此外,与F单倍型相比,H型和M型单倍型中缺失一个黄素单加氧酶(FMO,FLAVIN-CONTAINING MONOOXYGENASE)基因。(Vitis and M. rotundifolia)真葡萄属和圆叶葡萄属植物的总体结构和基因含量较为保守。尽管存在较大的倒置,但M. rotundifolia的M型基因含量和顺序与Vitis的M型相似,M. rotundifolia的F型基因含量和顺序与Vitis的F型基因含量和顺序相同(Fig. 2d)。最后,在SDR的前60kbp范围内,H单倍型的结构与F单倍型相似,但在该区域下游,其结构上与M单倍型更相似(Fig. 2d)。
与性别连锁的多态性影响蛋白序列
我们利用赤霞珠H单倍型的序列做比对,来鉴定葡萄属植物中与性别密切相关的单核苷酸多态性SNPs。所有的F-和M-相关的多态性都是在赤霞珠2号染色体中hap1拷贝的4801876到5061548的位置发现的(Fig. 3a; Supplementary Data 2; Supplementary Fig. 2),这些区域随后确认并界定为SDR区域。共有1275个SNPs被12个葡萄F单倍型与H和M单倍型共享,270个SNPs被3个M单倍型与F和H单倍型共享。有趣的是,M单倍型连锁的SNP在SDR区域的前8 kbp中最密集(4801876-4809592区间包含176个SNPs),而第一个与F单倍型连锁的SNP在M单倍型连锁的SNP密集群下游约40 kbp处(4842196; Fig. 3a)。虽然由于两属间的差异,性别特异性SNP的数量有所减少,但在比较中加入圆叶葡萄单倍型后,性别特异性SNP的分布基本一致(Supplementary Fig. 3)。
许多与性别连锁的SNPs会改变编码的氨基酸(Fig. 3b)。总的来说,我们发现了6个与M单倍型连锁的非同义SNPs:其中两个在YABBY转录因子(TF)编码的基因VviYABBY327上,两个在醛缩酶编码基因中,一个在海藻糖-6-磷酸酶(TPP)编码基因中,还有一个在第三个FMO基因中。这些非同义的与M单倍型连锁的SNPs代表了潜在的雌性不育突变。同样的,我们在10个基因中检测到了89个F单倍型特异性的非同义SNPs(Supplementary Data 2)。这些非同义SNPs分布在下列基因中,其中TPP(1)、VWINP1(1)、exostosin-coding gene(7)、3-ketoacyl-acyl carrier protein synthase III gene (KASIII)(3)、PLATZ TF-coding gene (PLATZ)(7)、first FMO gene(18)、the second FMO(26)、the third FMO(11)、the hypothetical protein VviFSEX(11)、VviAPT3(4)。其中3个SNPs在4个FMO基因的前两个中引入了一个提前终止密码子(Fig. 3e)。
为了更好地理解SDR区域的进化历程,进一步鉴定雄性不育和雌性不育候选基因,我们根据葡萄的序列构建了每个SDR基因的系统发育树(Fig. 3f; Supplementary Fig. 4)。在大多数SDR中,等位基因倾向于按性别分类,聚类模式随基因座的变化而变化(Fig. 3f; Supplementary Fig. 4)。从VviYABBY3到醛缩酶基因开始的4个基因的系统发育树将除F和H单倍型序列外的大多数M单倍型序列聚集在一起,VviYABBY3和醛缩酶等位基因形成了将M与F和H单倍型同源序列分开的分支(Fig. 3f)。这种模式从TPP开始转变;对于TPP、VviINP1、exostosin、KASIII、PLATZ、三个FMO、假设的蛋白质基因VviFSEX和VviAPT3,F单倍型序列聚集在M和H等位基因之外(Fig. 3f)。这些系统发育与观察到的性别特异性多态性是一致的(Fig. 3a, b),F-like H单倍型位于该区域的开始,M-like H单倍型位于该区域的结束(Fig. 2)。该区域边缘的基因不会按性别进行单倍型的分类,这进一步支持了我们对SDR边界的推断(Fig. 3f; Supplementary Fig. 4)。总之,这些观察结果与通过醛缩酶和TPP基因附近的重组事件而出现的H单倍型一致,在那里性别特异性的聚类模式发生了变化(Fig. 3e)。
VviINP1基因上的一个INDEL在所有雌性单倍型中都是保守的
除了SNPs之外,我们还分别鉴定出156个和25个小的INDELs(≤50 bp),这些小INDELs是所有F和M单倍型相对于赤霞珠H参考序列所共有的。这些INDELs中只有两个位于外显子区(Supplementary Data 3):1) 第一个FMO编码基因中的一个21bp的INDEL,在H和M等位基因中引入了一个过早终止密码子;2) 拟南芥INP1(AT4G22600)在葡萄中的同源序列上一个8bp的INDEL,导致所有F等位基因移码并引入一个提前终止的密码子(Fig. 4a)。F单倍型上VviINP1等位基因中的一个8bp INDEL导致该蛋白序列被截断为41个氨基酸(228 amino acids in H/M haplotypes)。因为在圆叶葡萄(M. rotundifolia)中的F单倍型中也发现了同样的8 bp缺失(Fig. 4a),这种F-特异性INDEL可能发生在葡萄和圆叶葡萄分化之前,因此可能在葡萄中广泛传播。按性别类型对葡萄和圆叶葡萄的INP1蛋白进行系统发育分析,确定INP1等位基因的性别特异性(Fig. 4b; Supplementary Fig. 5)。
INP1等位基因的性别特异性为估计M、F单倍型之间的分化时期和雌雄异株的潜在分化年限提供了可能。我们计算了INP1的所有52对F和M等位基因之间的平均同义距离(Ds)为每个碱基0.0275个替换(95% 置信区间: 0.0258-0.0292)。假设一个世代时间为3年,每年每个碱基的核苷酸替代率为2.5 × 10-9,我们推断,M和F等位基因大约在1650万年前分化(95% 置信区间: 15.5-17.5),这个值在葡萄属和圆叶葡萄属之间估计分裂时间的不确定范围内。
为了进一步研究VviINP1基因的性别特异性,设计了PCR引物扩增该基因的INDEL特异性等位位点。对另外7份栽培葡萄(HF和HH基因型)和两个更远的中亚葡萄品种,V.piasezkii(雄株;MF)和V.romanetii(雌株;FF)进行了分析。推测功能性VviINP1等位基因只存在于含有H和M单倍型的基因型中,INDEL只存在于含有F单倍型的基因型中(Fig. 4c)。用同样的 PCR 标记对两个 F1群体进行筛选,在Vv vinifera× V. arizonica F1 群体的218个个体中,雄株102个,雌株100个,不产生任何花序的16个;而Vv vinifera × Vv sylvestris F1群体由92个雄株、78个雌株和8个无花序植株组成。两个 F1群体的性状分离均为1:1,与 FF × MF 杂交结果一致(χ2 = 0.02, d.f. = 1, P value = 0.890; χ2 = 1.15, d.f. = 1, P value = 0.283)。在这两个群体中,所有具有雌花的 F1个体都是假定无功能的 VviINP1等位基因的纯合子。所有 F1代雄花都携带一个VviINP1的功能拷贝和一个非功能拷贝(Supplementary Figs. 6, 7; Supplementary Data 4−5)。基于全基因组测序方法对120个 Vv vinifera × V. arizonica F1群体的基因型进行了重复性整体分析,证实了VviINP1基因8bp 的缺失以及SDR中的所有其他性别连锁序列的多态性(Supplementary Fig. 8)。最后,值得注意的是,VviINP1的位置对应于50份Vv vinifera(HF)材料的连锁不平衡峰值(r2 = 0.77)(Fig. 3c),说明这个位点的重组受到抑制。
因为INP1的功能性拷贝是玉米可育花粉发育所必需的,这些结果支持了8 bp缺失导致纯合葡萄雌性不育的假设,并可能是Vv sylvestris雌性花粉粒表面萌发沟缺失的原因。综上所述,序列、系统发育、关联分析和功能证据表明,一个包含8 bp缺失的VviINP1隐性等位基因影响雄花发育功能,这使得VviINP1成为一个可能的雄性不育候选基因。
性别连锁基因具有不同的表达模式
为了评估性别连锁多态性对SDR基因调控的潜在影响,我们在转录起始位点上游3 kb 区域内寻找性别连锁的TF结合位点(Fig. 3d; Supplementary Fig. 9; Supplementary Data 6)。在编码含PPR蛋白VviYABBY3、醛缩酶、KASIII、FMOs和VviFSEX基因的上游发现与M单倍型连锁的TF结合元件。VviYABBY3启动子区的两个与M单倍型连锁的TF结合元件与开花和花发育有关,其中包括短营养期(SHORT VEGETATIVE PHASE,SVP),SVP 参与温度调控开花时间,BES1-INTERACTING MYC-LIKE1(BIM1),一种油菜素甾体信号成分,参与拟南芥雄性生殖。同样,我们鉴定了VviINP1、exostosin、KASIII、PLATZ、FMOs、VviFSEX、WRKY和VviAPT3上游F单倍型所特有的TF结合序列(Fig. 3d; Supplementary Data 6)。与此相反,所有F单倍型在VviAPT3启动子区附近都缺乏bHLH TFs和AGAMOUS-LIKE 3的TF结合位点(Supplementary Fig. 10a)。
其中一个WRKY基因,因其潜在的功能,而对性别特异性TF结合位点特别感兴趣。在H和M单倍型中,WRKY启动子区有11个TF结合元件,而在所有的F等位基因中均不存在。这些TF结合位点与影响拟南芥开花时间和发育的转录因子有关。性别特异性转录因子结合元件的显著多样性表明,位于SDR之外的转录因子可能对SDR内的基因进行复杂调控,这可能受到环境因素的影响。此外,单倍型间转录因子结合位点的分布表明,许多SDR上基因可能受到性别特异性的差异调控。
为了研究性别特异性调控,我们用RNA-seq定量分析雌雄同花Vv vinifera Chardonnay (HH)和雄花、雌花、Vv sylvestris DVIT3351.27(MF)和O34-16(FF)花芽的转录丰度。先前的研究已经分析了 SDR 中的基因表达,并比较了不同性别的花。然而,这些数据是从花的早期发育阶段取样的,可能错过了性别决定的后期阶段。因此,我们采集了花的三个发育阶段: (i)生殖结构的早期发育阶段;(ii)花粉成熟前期;(iii)开花期。测序reads被比对到赤霞珠基因组的两个单倍型上并比较每个发育阶段的个体之间的表达水平。我们关注的是那些表现出性别特异性表达谱的基因,例如:与雄花和两性花相比,雌花中表达较高(或较低)的基因。
在至少一个发育阶段,有十三个基因符合这个标准(Fig. 5a; Supplementary Data 7)。例如,令我们吃惊的是,VviINP1在开花前后的雌花中的表达明显高于雄花和两性花(adjusted P value ≤ 0.05)。同样,WRKY在雄花和两性花中各发育阶段的表达均高于雌花。三个基因仅在一个时期呈现差异表达: TPP,aldolase and beta-fructofuranosidase (BFRUCT)(Fig. 5a)。两个基因在雄花中两个或两个以上发育阶段表达增强: VviAPT3在雄花三个发育阶段表达增强,VviYABBY3在后两个发育阶段表达更高。VviAPT的结果与先前的研究一致,即高VviAPT3转录本丰度是Vv sylvestris雄花的心皮原基所特有的,这表明VviAPT3在心皮败育中起作用(Supplementary Fig. 10b)。值得注意的是,VviAPT3在雄花中的高表达在H和M单倍型等位基因是特异的,而F等位基因在不同性别类型中的表达在各个发育阶段都不断降低(Supplementary Fig. 10b, c)。这表明M和H单倍型中,VviAPT3等位基因的表达水平或剂量可能影响性别决定。对于VviYABBY3,我们还通过将RNA-Seq的reads比对到DVIT3351.27参考基因组上,证实了相对于F等位基因,雄性花中M等位基因的高表达是特异的(Supplementary Data 8)。鉴于VviYABBY3中的序列多态性与M单倍型是完全连锁的(Fig. 3a),且该基因位于赤霞珠H单倍型的一部分,类似F单倍型(Fig. 2d),推测VviYABBY3的M等位基因可能与雌性不育有关。
差异表达的 SDR 基因包括 TFs 和与激素信号相关的基因,这些基因可能在共表达网络中发挥重要的调控作用。为了评估性别连锁基因和其他基因组中可能影响发育的基因之间的关系,我们进行了跨发育阶段的加权基因共同表达网络分析(WGCNA)(Supplementary Data 9)。六组共表达基因(共6830个基因)与三种性别表型之一呈正相关或负相关(|Pearson correlation| > 0.9,P value < 8e-11; Supplementary Fig. 11)。例如,1176个共表达基因的洋红模数与雄性表型有关(Pearson correlation = 0.97;P value = 2e-16)。这个模块在SDR区包含两个基因,分别编码PPR-containing protein and VviAPT3。该模块还包括与激素信号相关的基因,如与AtUGT85A1和AtUGT85A3同源的2个尿苷二磷酸糖基转移酶(UGTs),它们可能参与活跃的细胞分裂素稳态。WRKY的表达位于红色模块(1512 genes;Fig. 5c)的中心(即高度相关),与雌性性别决定呈负相关(Pearson correlation = -0.92;P value = 6e-12)。该模块包括一个对花器官发育必不可少的MADS-box基因,它是拟南芥SEPALLATA1 (SEP1;AT5G15800)的同源序列。总之,这些数据表明,性别连锁多态性影响某些SDR基因的调控,而且其中一些基因在参与性别决定和其他发育过程的共表达模块中高度相关。
Discussion
葡萄中的雌雄异株是很有趣的,因为葡萄藤是少数古老的雌雄异株植物之一,在驯化过程中恢复为雌雄同体。从结构上看,野生葡萄有完整的花(Fig. 1a, b),但雄花和雌花分别缺少功能性雌蕊和花粉。正如对大多数被子植物所推测的那样,这些野生葡萄花很可能起源于雌雄同体的祖先,雌雄异株是由独立的、连续的雄性不育和雌性不育突变引起的。在双基因座模型下,第一步是隐性雄性不育突变的进化,第二步是显性雌性不育突变的形成。
通过将Vitis-SD单倍型映射到赤霞珠的H参考序列上,我们发现了不同的M连锁和F连锁多态性模式。M连锁多态性发生在从PPR蛋白启动子到TPP基因的5′区。相比之下,F连锁多态性从TPP到VviAPT3(Fig. 6a)。在雌雄异株起源的双位点模式下,显性雌性不育等位基因可能是M单倍型所独有的,因此位于M单倍型与F和H单倍型不同的区域。这缩小了在M连锁多态性升高区域寻找雌性不育位点的范围(Fig.3a–e)。值得注意的是,与M连锁的SNPs聚集在VviYABBY3附近,VviYABBY3蛋白序列清楚地区分了M与F和H单倍型(Fig. 3f)。此外,VviYABBY3还含有两个M-特异性TF结合位点,在花发育过程中表现出M-连锁基因表达模式(Fig. 5a)。因此,我们推测,向雌雄异株转变的关键步骤之一,要么是由VviYABBY3蛋白的氨基酸变化和/或VviYABBY3基因的上调引起的,从而在雄花中导致雌性不育。关于YABBY基因家族的功能信息与这一假说是一致的。在拟南芥中,YABBY基因参与了植物花器官和侧生器官的发育,尤其是心皮和胚珠外珠被的发育。虽然VviYABBY3还没有被阐释,但V. pseudoreticulata VpYABBY1和VpYABBY2在拟南芥中的表达(以及VvYABBY4在番茄中的表达)暗示了这些基因在叶和心皮发育中的作用。
类似地,F连锁多态性定义了SDR的一个区域,该区域可能存在假设的隐性雄性不育突变。从TPP到VviAPT3,SDR的后一部分存在F连锁多态性(Figs. 3 and 6a)。在该区域的基因中,WRKY和VviINP1是最值得注意的。与雄花相比,WRKY基因在雌花中的表达较差(Fig. 5a),并且是与雌花性别决定呈负相关的共表达模块中的一部分(Fig. 5c),因此从理论上讲,WRKY的表达可能导致雄性不育。然而,在我们看来,VviINP1基因中的8bp缺失才是导致雄性不育的最可能原因(Fig. 4a)。这种纯合子缺失导致的整个葡萄属F等位基因移码和密码子的提前终止(Fig. 4c),表明其在葡萄种植史中一直保持着。INP1参与了葡萄和玉米花粉孔形成,葡萄功能缺失突变可能解释了雄性不育花粉的形成。所有F1代雄性至少含有一个VviINP1功能基因(Fig. 4c; Supplementary Figs. 6 and 7),这表明如果VviINP1中的8bp缺失导致雄性不育,那么其则为隐形等位基因。特别是考虑到我们的假设,即缺失事件使VviINP1蛋白的F等位基因失去功能,但为什么VviINP1在雌花中的表达更高,目前尚不清楚(Fig. 5a)。一种可能是高表达构成了一种补偿效应,类似于CRISPR基因敲除的报道。鉴于我们假设VviINP1缺失导致雄性不育,未来的一个重要步骤将是功能验证,将纯合子缺失改造成雌雄同体产生雌性花。
与VviINP1一样,VviINP3位于SDR的后一部分,并且具有F连锁多态性,因此其位置可能在雄性不育中发挥了作用。然而,VviAPT3在雄花中表达较高,其共表达模式与雄花性别有关。这些结果与Coito等人描述的基因表达模式一致。这些数据表明VviAPT3参与了花的发育和性别决定,但它的作用机制使复杂的,需要进一步的研究来充分理解。
据推测,M和F单倍型之间的重组导致H单倍型的还原。若干证据支持H单倍型产生于一个重组事件的假设,包括它们与SDR第一部分的F个单倍型和SDR后一部分的M个单倍型的中间长度、结构和序列的相似性(Fig. 6a)。根据我们的数据,我们也可以定位假设的重组事件。系统发育证据表明,醛缩酶与TPP基因发生重组,多态性信息表明TPP基因可能发生重组,因为该基因序列包含M-连锁和F-连锁的非同义SNPs(Figs. 3a–f, 6b)。然而,我们注意到,有证据表明H单倍型在驯化的葡萄中起源不止一次,着表明H单倍型中可能存在不同的重组断点。
最后,我们还提出了一个关于重组的问题:如果F和M等位基因可以重组,那么是什么让这两个单倍型保持了这么长时间的不同?既然自该属起源以来,雌雄异株就一直在野外存在。这是一个特别重要的问题,因为被子植物中雌雄异株稀少是由于很容易恢复到雌雄同体。我们推测M和F单倍型之间的重组是由葡萄属SDR的至少三个特征决定的。首先,性别决定基因的紧密联系可能仅仅反映了生理上的亲密关系。如果我们关于VviYABBY3和 VviINP1是不育基因的假设是正确的,那么重组事件必须发生在< 100kb,这样就可以将这两个基因分开,从而产生H单倍型。其次,并不是所有的重组活动在自然界中都是成功的:只有50%正确的重组体会成为雌雄同株(Fig. 6b),而且可能会有与雌雄同株相关的适应性代价。最后,我们推测M和F单倍型在结构和长度上的差异主要是由TE在基因间空间的积累造成的,限制了重组,因为等位基因间TE含量的差异会减缓重组的速度。在这种情况下,M. rotundifolia的倒位作用相对于F单倍型中57%的M单倍型,可能是一种特别有效的威慑,因为倒位可能是重组的障碍。我们怀疑这三个特征导致了野生葡萄雌雄同体的明显缺失。
补充
关于泛基因组及基因组组装,近期在NG上发表的两篇文章与本文有点类似,一篇来自黄三文团队,该研究首次完成了杂合二倍体马铃薯的单倍体型组装,获得了两套染色体的基因组序列,并在此基础上揭示了杂合基因组内丰富的序列变异、等位基因表达差异、甲基化修饰差异以及有害突变的分布模式。另一篇来自康奈尔大学Boyce Thompson Institute费章君团队,该研究通过三代基因组测序手段对栽培苹果 (Malus domestica cv. Gala)及其两个主要的祖先种野生苹果(M. sieversii 和 M. sylvestris)进行基因组测序和组装,同时对91个苹果种质进行泛基因组研究,全面系统地解析了苹果的起源、驯化历程和遗传学基础。两篇文章均涉及到杂合二倍体基因组的组装,均采用了Pacific Bioscience Sequel II platform平台的HIFI模式。基于不同的单倍型,结合单核苷酸多态性(SNPs)及结构变异将长测序读长拆分,然后分别组装成contigs,再结合其他辅助手段挂载。
Haplotype-resolved genome analyses of a heterozygous diploid potato
Sun, X., Jiao, C., Schwaninger, H. et al. Phased diploid genome assemblies and pan-genomes provide insights into the genetic history of apple domestication. Nat Genet (2020). https://doi.org/10.1038/s41588-020-00723-9
Phased diploid genome assemblies and pan-genomes provide insights into the genetic history of apple domestication
Zhou, Q., Tang, D., Huang, W. et al. Haplotype-resolved genome analyses of a heterozygous diploid potato. Nat Genet 52, 1018–1023 (2020). https://doi.org/10.1038/s41588-020-0699-x