Science 发表了题为“Dual domestications and origin of traits in grapevine evolution”的研究成果,并被选为当期封面。该研究广泛收集了全球3,525份栽培和野生葡萄种质资源,解析了葡萄的进化和驯化历史,揭示了栽培葡萄的两种驯化模式,纠正了葡萄单一起源中心理论。
概况
汇集全球约5000份葡萄遗传资源,在疫情期间坚持工作,完成了迄今为止植物领域最大的基因组分析工作,绘制了栽培葡萄野生种的参考基因组、解析4000多份葡萄遗传资源的基因组多样性信息,开发了大量数据分析方法。该研究提出了几个重要的观点:
1、阐述栽培葡萄起源的时间大约在距今11000年前,远比此前认知的要早,表明葡萄是最早驯化的水果,这一观点为研究作物起源驯化、葡萄栽培考古学研究提供了重要的线索;
2、揭示栽培葡萄驯化中心为两个,为双起源中心模式,纠正了此前的单起源中心理论,是葡萄研究的重要里程碑结果;
3、证明酿酒葡萄和鲜食葡萄在不同区域同时起源,并且起源初期遗传背景就具有重大的差异,彻底解决了学术界对鲜食葡萄和酿酒葡起源长达数百年的争议;
4、构建几乎覆盖所有栽培葡萄遗传资源高精度亲缘关系谱系图,可以实现葡萄品种的定向育种和设计育种;
5、发现了大量的葡萄人工驯化形状控制基因,特别是找到了酿酒葡萄和鲜食葡萄人工驯化的差异基因,为葡萄功能基因组学研究和育种提供素材。
6、在这些研究基础上,我们结合人类活动、历史气候变迁等因素,绘制了葡萄起源和人工驯化、改良的全景图。
背景
作为食物来源(鲜食葡萄和葡萄干葡萄)和酿酒原料(酿酒葡萄)的栽培葡萄(Vitis vinifera ssp. vinifera,以下简称 V. vinifera),是欧亚大陆文明的文化象征。早期研究认为 V. vinifera 起源于其野生祖先 Vitis vinifera ssp. sylvestris(以下简称 V. sylvestris)。近年来,各种研究对葡萄单一起源事件的理论提出了质疑,认为西地中海、高加索和中亚区域存在葡萄的驯化中心。这些研究的差异主要是由于葡萄种质样本不足以及遗传数据分辨率有限有关。因此,本研究收集了全球大量的葡萄种质资源,系统解析了葡萄遗传多样性的结构,探索了葡萄的起源,推断了葡萄的传播历史,并研究了葡萄关键的驯化特征和多样化特征。
结果
首先组装了一个染色体水平的葡萄参考基因组(VS-1)用于遗传变异检测。在广泛收集的3,525份葡萄品系中(2,503份V. vinifera和1,022份V. sylvestris)共检测了45,624,306个SNP和7,314,397个Indel,并且大部分变异是稀有变异(次要等位基因频率≤1%)。移除克隆重复以及种间杂交个体后,最终保留了2,448份葡萄品系(1,604 V. vinifera和844 V. sylvestris)用于后续分析(图1A)。
01 八种不同祖先成分区分核心种质
PCA结果显示PC1和PC2将 V. sylvestris 和 V. vinifera分开,并大致呈现出葡萄从西亚到西欧的一个分布梯度(图1B)。V. vinifera的地理栽培模式与遗传结构之间相关性较弱(图1C)。对葡萄品系进行遗传成分评估(图1D),当K=2时,所有V. vinifera品种都含有大部分的东方(红色)祖先成分,与东地中海地区的V. sylvestris的祖先成分相同。在K=8时,V. sylvestris共分为了4个不同地理区域的类群:西亚(Syl-E1)、高加索(Syl-E2)、中欧(Syl-W1)和伊比利亚半岛(Syl-W2)(图1,D至F),V. vinifera共分为了6个不同的类群(CG1至CG6)(图1,D至F)。4 个 V. sylvestris 类群和 6 个 V. vinifera类群在PCA中各自聚为一簇 (图1G)。
02 V. sylvestris 生态型之间在更新世分化
根据V. sylvestris的遗传成分以及在欧亚大陆西部所占据的生态位,将西亚和高加索地区的 V. sylvestris 种质定为东部生态型(以下简称Syl-E),将中欧和伊比利亚半岛的 V. sylvestris 种质定为西部生态型(以下简称Syl-W)(图2A)。Syl-E在约40万~80万年前和Syl-W在约15万~40万年前发生过种群瓶颈,约4万年前两个生态型经历了第二次种群瓶颈,Syl-W生态型瓶颈期后有效种群大小显著回升,但近期有效种群大小数量下降到较低水平(图2B)。更新世时期气候的周期变化,也见证了两种生态类型之间的分化(图2C),并在末次冰期时完全分化(图2D)。
03 V. vinifera 的双重起源
全新世早期(11,700 – 8,300年前)潮湿的气候促进了Syl-E适宜栖息地的扩张,形成了从中亚到伊比利亚半岛的地理跨度(图2D)。这种扩张支持了V. vinifera东部起源和随后大陆传播的假设。由于CG1与Syl-E1共享主要祖先成分,CG2与Syl-E2共享主要祖先成分(图1,D至F),推测葡萄可能存在两种驯化事件。在所有CG组中,CG1和CG2遗传多样性最高,与相对应的野生生态型(Syl-E1、Syl-E2)的遗传分化较小(图3A)。并且CG1和CG2分别在遗传上更接近Syl-E1和Syl-E2(图3B),CG1/Syl-E2和CG2/Syl-E1的群体分化轨迹与Syl-E1/Syl-E2相似,而与CG1/Syl-E1和CG2/Syl-E2的群体分化轨迹不同(图3C)。这些数据共同支持了V. vinifera有两种的起源假设,CG1/Syl-E1和CG2/ Syl-E2的驯化事件在农业文明出现前后同时发生,否定了葡萄单一驯化中心的理论。CG1和CG2分别代表了食用葡萄和酿酒葡萄这两种古老的遗传背景,因此V. vinifera双重起源的假设也否定了酿酒葡萄早于食用葡萄的假设(图3C)。
04 葡萄驯化沿着人类迁徙路线传播
CG1和CG2在欧亚大陆和北非的地理分布对应着两个葡萄类群截然不同的人类迁徙路线(图3D)。CG2品种主要分布于高加索山脉的两侧,在黑海北部的喀尔巴阡盆地也有少量分布。这一结果与之前研究认为CG2在欧洲酿酒葡萄多样性形成中发挥了核心作用的结果相悖。在本研究中,CG2对葡萄品种多样化影响不大。相比之下,CG1在欧亚大陆和北非的四个方向上扩散。首先,通过中亚向东扩张到印度和中国,这条道路也见证了小麦、大麦和小米等作物在西方和东方之间的交换。第二,越过扎格罗斯山脉与高加索地区,向北的扩张可能反映了西亚早期的文化交流。第三,通过安纳托利亚进入巴尔干半岛的西北扩张预示着农业向欧洲的传播。最后,向西扩张越过北非海岸线到达摩洛哥。尽管本研究推断的葡萄驯化路线遵循人类迁徙足迹,但未来需要古基因组数据来进一步确定时间和传播细节。
05 CG1和CG2中共享和独有的驯化特征
在葡萄双重起源的假设下,利用核苷酸多样性和遗传分化来探究Syl-E1/CG1和Syl-E2/CG2的驯化特征(图3E)。CG1和CG2大多数共享的选择性扫描信号(FST)位于2号和17号染色体上,主要跟性别决定区域、浆果颜色和浆果发育有关。与双重驯化预期结果一致,CG1和CG2中的大多数选择性扫描区域都是特有的。CG1和CG2中许多独特的特征表明存在一种针对共同驯化性状不同方面的趋同选择机制。例如通过减少生物碱的生物合成(CG1中的MecgoR基因簇和CG2中的TR2和SSL基因簇)和增强碳水化合物代谢(CG1中的SWEET17和CG2中的PFKFB1)来改善葡萄浆果的风味,与浆果成熟(CG1中与花香有关的BEAT基因簇和CG2中与浆果颜色有关的UFGT基因簇)和对环境的响应(CG1中的UPL6和CG2中的WAK)等。
06 欧洲酿酒葡萄品种多样化
早期的CG1驯化品种通过安纳托利亚传播到欧洲(图3D),欧洲酿酒葡萄在随后几千年的多样化历史是怎样的。全新世早期Syl-E和Syl-W适宜栖息地的共享区域(图2D中的黑色区域),为CG1与地中海北部等地区避难所的Syl-W种质间遗传物质交换提供了生态基础。因此,研究与Syl-W渐渗相关的不同葡萄遗传祖先(CG3至CG6)在何处以及如何形成是很重要的。TreeMix分析发现了一条从Syl-W到CG3到CG6的基因流(图4A),表明在欧洲葡萄品种多样化之前,就发生了古老的渐渗事件。从Syl-W到CG6还有一个额外的基因流,表明是西欧酿酒葡萄所特有的渐渗事件。D-统计检验进一步验证了Syl-W流入CG这一渐渗事件(图4B)。此外,从Momi2推断的Syl-W流入CG3到CG6的基因流与它们从CG1的相应分化一致,进一步支持了渐渗事件。估计的分化时间可追溯到马斯喀特葡萄(CG3)为10,500年前,巴尔干酿酒葡萄(CG4)为8,070年前,伊比利亚酿酒葡萄(CG5)为7,740年前,西欧酿酒葡萄为6910年前(图4D)。这些逐步多样化的历史与安纳托利亚农民迁徙到欧洲的历史一致,证实了葡萄在形成新石器时代农业社会中的作用。
07 驯化与多样化性状的遗传分析
V. sylvestris(雄性,M/f;雌性,f/f)从雌雄同体到V. vinifera雌雄同体的转变是驯化过程中最显著的表型变化,是由于2号染色体的性别决定区域(SDR)发生了M 和f之间的重组事件(图5A)。先前的研究已经鉴定出两种主要的雌雄同体单倍型(H1和H2)和四种雌雄同体基因型(H1/f, H2/f, H1/H1和H1/H2),但对重组事件尚不清楚。本研究揭示了SDR中的5个重组位点(图5B),不仅证实了已知的基因型,而且还确定了新的次要(minor)单倍型(雄性变异Mv、雌性变异fv、H3、H4 和 H5)和基因型(Mv/f、M/H1、M/H5、H1/fv、H5/f、H4/f、H2/H2和H2/H3)(图5B),SDR基因型统计发现含有H2的SDR在伊比利亚(CG5)和西欧(CG6)葡萄中存在分布偏差(图5C)。为所有已知的SDR单倍型推测了一个重组历史事件(图5D),发现亲本M和f单倍型之间的第一次重组事件产生了Mv(位点4),fv(位点3),H1(位点2)和H4(位点1)。在此基础上,H1与f发生第二次重组,生成H3(位点5)和H5(位点4),H4与f在位点5再次重组,生成H2。由于该群体中的3个Syl-E V. sylvestris (IS164、IS167和IS180)和11个V. vinifera品种含有H4单倍型,推测H4单倍型在人类选择后向西扩散到伊比利亚半岛,H2单倍型起源于H4单倍型的二次重组,在伊比利亚和西欧品种的多样化过程中占据主导地位(图5E)。
总结
本文基于对V. sylvestris和V. vinifera的系统研究,清晰描绘了与气候变化和人类迁徙历史关键事件相对应的葡萄驯化历史(图6),是葡萄研究中一个重要的里程碑结果。通过在全球广泛收集野生葡萄和栽培葡萄的种质资源,阐述了栽培葡萄的起源时间,对其它作物起源和驯化的研究具有借鉴意义。揭示了栽培葡萄的两个起源驯化中心,推翻了以往单一驯化中心的结论。发现食用葡萄和酿酒葡萄在同时起源于不同地区,解决了对二者起源的争议。发现了许多与人工驯化性状相关的基因,为葡萄定向育种以及良种选育等工作提供参考。
https://mp.weixin.qq.com/s/2u3m2tcHLeH2ABilaZCY8A
https://mp.weixin.qq.com/s/L8bCIPvvY4piL-HPihp99g