Hall D, Hallingbäck HR, Wu HX (2016) Estimation of number and size of QTL effects in forest tree traits. Tree Genet Genomes 12:110. doi: 10.1007/s11295-016-1073-0
映射森林树木性状的遗传结构是重要的,以了解塑造这些性状的进化力量,并促进基于基因组的育种策略的发展。我们使用30个发布的映射研究(链接和关联映射)在林木中检查影响八种类型性状的等位基因影响的数量,大小和分布。等位基因效应的大小,作为解释的表型方差测量,通常显示严重右偏态分布。我们通过改进以前由Otto和Jones开发的方法(遗传学156:2093-2107,2000),估计不同性状类别的潜在因果效应(nqtl)的数量。基于关联作图研究的nqt1的估计通常比基于连锁作图(中值为33)的那些高(中值在643)
。与模拟连锁和关联映射数据的比较表明,连锁图谱研究的较低nqtl估计可以部分地解释为通常使用的全同胞家族群体内较少的因果基因座分离,但也由于有限重组的因果基因座的群体分离。基于连锁图谱研究的疾病抗性估计具有四种潜在效应的最低中值,而基于关联作图的生长性状具有约580种效应。理论上,50%的遗传变异的捕获因此将需要约200的种群大小用于连锁作图中的抗病性,而在缔合作图中的生长性状将需要约25,000
。改进方法的充分性和可靠性通过应用于模拟数据成功验证。
介绍
了解适应性和商业性状的复杂结构以评估进化力在塑造遗传变异中的作用并改善长期育种策略是非常重要的。遗传标记的引入具有快速可靠的人类遗传疾病诊断的承诺,动物和植物育种中的标记辅助选择以及对适应的遗传基础的更好理解(Neale和Savolainen 2004)。在玉米和拟南芥中,基于几个性状的遗传基础已被相对良好地鉴定为可遗传性状变异的主要部分(分别> 50和> 80%)由定量性状基因座(QTL )(Buckler等人2009; Segura等人2012)。相比之下,人类的高度被认为是高度可遗传的,但大部分的遗传变异仍然无法通过全基因组关联研究(GWAS)。这种不可解释的遗传变异称为Bs缺失遗传性(Maher 2008)。最近的研究指出了每个对人类高度具有小影响的许多QTL的基础结构(Yang等人,2010)。单独地,这些QTL因此保持未通过GWAS方法检测,但是,一起,它们仍然解释大多数遗传变异。与此一致,理论工作已经显示,大效应的等位基因可能是异常的,并且已经建议等位基因效应遵循负指数分布(Orr 1998)。这反过来意味着大多数遗传将由许多具有小效应大小的等位基因解释(McKown等人2014; Porth等人2013; Rockman 2012; Yangetal。2010),并且检测到的等位基因效应的大小将形成truncateded指数分布(Otto和琼斯2000)。在开花时间inmaize和拟南芥的研究中,检测到的QTL的等位基因效应分布被描述为刚好在检测阈值以上的效应量的观察到的QTL的数量的快速增加,但是在较大的效应尺寸下显着降低,从而形成稀有大QTL效应的Blong尾(Buckler等人2009;Salomé等人2011)。当观察检测到的QTL效应的效应大小分布时,这种趋势在大多数植物中似乎是相似的(Ingvarsson和Street 2011)。
历史上,通过在极端表型或相关物种之间的交叉设计中的连锁分析检测QTL(称为QTL研究)。 QTL研究确定了与由于物理连锁导致的遗传节段聚集相关的显着影响。对于本文中处理的QTL研究,这些遗传区段在遗传距离方面的范围为0.9至60cM(Henery等人2007; Jorge等人2005; Paterson等人1988; Thummaet al.2010) 。然而,更高分辨率的QTL检测可以通过连锁不平衡(LD)分析(也称为缔合作图)进行(Lander和Schork 1994; Pritchard et al.2000)。由于基因分型技术的局限性和缺乏资源,关联映射迄今为止主要使用候选基因方法进行(Thavamanikumar等人2013)。然而,这样的研究可能不能发现意想不到的关联,因为候选基因优先在先前的QTL研究(Frewen等人2000; Ingvarsson等人2006)或通过其他研究努力指示为重要的区域中选择。尽管如此,随着大规模基因分型变得越来越负担得起,全基因组方法关联作图可能是优选的方法,因为它不受候选基因选择约束的影响。值得注意的是,QTL和关联研究常常受到相对较小的绘图群体大小的限制,导致低的统计功效,因此使得小的或甚至中等效应QTL在统计学上不显着且难以检测。这种统计力量不足的人群也可能受到影响大小估计(所谓的Beavis效应)的严重通货膨胀,特别是如果应用非常严格的显着性阈值(Beavis 1994; Beavis 1998; Xu 2003b)。过度估计的大小不仅取决于研究的力量,而且取决于真实效应的大小。如果真实效应幅度小,则需要大的样本大小(例如,千个个体)以实现无偏的效应估计(Beavis 1998)。虽然QTL和关联研究中的理论基础已经有一段时间了,但是累积的实践和经验现在表明,鉴于检测到大量可遗传变异的目的,需要大量的样本量(Lynch和Walsh 1998; Sham et al。 2000)。如果抽样标记不包括因果等位基因,或者如果标记和致病等位基因之间的LD不完全,则功率降低,并且映射群体的大小需要进一步增加(Porth等人2013)。森林树木的关联研究数量仍然有限(Thavamanikumar et al。2013),但随着目前基因组研究在许多物种中的应用(Birol等人2013; Neale和Kremer 2011; Nystedt等人2013)对复杂性状的解剖和使用用于基因组选择(GS)的分子标记的育种效率正在增加(Meuwissen等人2001)。最近在Populus的常见花园试验以及Populous trichcarpa基因组序列的完成(Tuskan等人2006)已经在毛果蛾的几个全基因组关联作图研究中产生,其中标记物的数量比以前大得多候选基因方法(Evans et al。2014; McKown et al。2014; Porth et al。2013)。然而,在森林树中的几个映射研究表明大多数性状有大量的基础QTL,到目前为止,很少有研究,有映射人口规模,提供所需的功率捕获大部分的遗传变异Neale和Savolainen 2004; Thavamanikumar etal。2013)。研究基础QTL效应的预期数量及其分布可以增强我们对重要数量性状的遗传结构的理解,设计更好的实验以揭示遗传性的遗漏因子,并促进标记辅助选择(MAS)和基因组选择的实施(Isik 2014; Meuwissen and Goddard 2010; Thavamanikumar et al。2013)。在本文中,我们建议一个修改的方法,Otto和琼斯(2000年)为了估计基础QTL的数量从所报告的表型方差的大小解释的八个不同的性状类型的重要标记。我们还使用模拟数据来验证我们的关联映射和QTL映射程序的方法,并潜在地重现关联映射研究和QTL映射研究之间在QTL数量和它们的效应的大小分布方面的差异。此外,我们提供所需的人口规模的QTL映射和关联映射研究,旨在检测至少50%的基础的8种不同性状类型的基因变异的人口规模。