摘要
大部分遗传突变导致疾病,这些突变难以有效且无副作用的矫正。本文描述了prime 编辑,这是一种通用且准确的编辑方法,直接将新的DNA片段写入到特定的DNA位点。它由一个无催化活性的Cas9核酸内切酶和连接在一起的工程逆转录酶构成,与既包含定位信息又包含编辑信息的prime editing guide RNA (pegRNA)一起工作。在人细胞中进行了175次以上的编辑,包括靶向插入,缺失和所有12种类型的点突变,而无需双链断裂或供体DNA模板。在人类细胞中使用prime 编辑功能,可以有效地校正镰状细胞疾病(要求HBB发生颠换)和泰伊-萨克斯病(要求HEXA删除),且副产物很少;在PRNP中建立一个保护性颠换;将各种标签和表位精确插入目标基因座。四种人类细胞系和有丝分裂后的小鼠初级皮质神经元可以使用prime 编辑但是具有不同编辑效率。prime 编辑比同源性指导的修复具有相似或者更高的编辑效率,少的副产物更;与碱基编辑相比具有互补的优势和劣势;在已知的Cas9脱靶位点上具有低的多的命中率。prime 编辑极大地扩展了基因组编辑的范围和能力,并且原则上可以纠正多达89%的与人类疾病相关的已知遗传变异。
生命科学的长期以来一直希望能对任何活细胞或有机体的基因组进行有针对性的编辑。尽管基因组编辑技术取得了飞速发展,但人类超过75,000种已知的与疾病相关的遗传变异中的大多数仍然难以校正或安装?在大多数与治疗相关的细胞类型中(图1a)。可编程核酸酶(例如CRISPR–Cas9)产生双链DNA断裂(DSB),可通过在靶位点2–4诱导插入和缺失(indels)的混合来破坏基因。然而,DSB会导致包括混合产物,易位5和p536,7活化等后果。此外,绝大多数致病等位基因是由于特定的插入,缺失或碱基取代,需要更精确的编辑技术来纠正(补充图1a)。 DSBs8诱导的同源性定向修复(HDR)已被广泛用于精确的DNA编辑。HDR依赖外源供体DNA作为修复模板,通常会通过DSB的末端连接修复产生过量的indel,并且在大多数与治疗相关的细胞类型(T细胞和某些类型的干细胞是的例外)中效率低下9, 10。尽管提高DSB介导的基因编辑的效率和精度仍然有前途11-15,但是这些挑战促使人们探索替代方法。
正文
碱基编辑无需使用DSB可在许多细胞类型和生物中(包括哺乳动物16-19)执行四个转换突变(C→T,G→A,A→G和T→C),但目前无法执行八个颠换突变(C→A,C→G,G→C,G→T,A→C,A→T,T→A和T→G),例如需要从T•A到A•T突变纠正镰状细胞病(HBB(E6V))。此外,尚无报道采用无DSB的方法进行靶向删除,例如去除引起Tay-Sachs病的四碱基重复(HEXA1278 + TATC),或靶向插入,三碱基插入纠正囊性纤维化(CFTR(ΔF508))。因此,即使在大多数细胞类型中,有针对性的颠换,插入和删除也很难有效无副产物的纠正,即使它们共同构成了大多数已知的致病等位基因(图1a)。
在这里,我们描述了prime编辑的发展,一种“搜索并替换”的基因组编辑技术,可以在人细胞中介导目标插入,删除,所有12种可能的碱基间转换及其组合,而无需DSB或供体DNA模板。最初以PE1为例的prime编辑器(PE)使用与RNA可编程切口酶融合的逆转录酶(RT)和prime编辑向导RNA(pegRNA)将遗传信息直接从pegRNA的延伸区复制到目标基因组位点。 PE2使用工程RT来提高编辑效率,而PE3切掉未编辑的链以诱导其替换并进一步提高编辑效率,通常在人HEK293T细胞中达到20-50%效率且形成1-10%插入缺失。
prime编辑在已知的Cas9脱靶位点具有低的多的命中率,且具有更少的副产物,与Cas9相比,具有相同或者更高的编辑效率。与碱基编辑相比具有互补的优劣势。无需DSB或者供体模板DNA即可进行靶向插入,缺失和所有12种可能的点突变类别。
引物编辑策略
Cas9使用含有间隔区序列的引导RNA靶向DNA,该间隔区序列与目标DNA位点杂交2-4、20、21。 我们设想生成既能指定DNA靶点又包含新遗传信息的指导RNA。 为了将信息从这些工程指导RNA转移到靶DNA,我们提出在靶位点切口,暴露出3'-羟基用于引导engineered guide RNA (the pegRNA)上编辑好的序列反转录直接进入靶位点(补充图1b,c,)。 这些初始步骤产生了带有两个冗余单链DNA侧翼的分支中间体:5'端侧翼包含未编辑DNA的序列的,3'端侧翼包含从pegRNA复制的人工序列的(图1c)。 从热力学上看,完全互补的5'端侧翼与未编辑链的杂交可能是更容易的,但5'端侧翼是结构特异性核酸内切酶(如FEN122)的首选底物,该酶可在DNA合成过程切除中滞后链的或者long-patch base excision repair产生的5'。 多余的未编辑DNA也可以通过5'核酸外切酶(例如EXO123)去除。
我们认为,优先进行5'端侧翼切除和3'端侧翼连接可以驱动已编辑的DNA链的掺入,从而产生包含已编辑链和未编辑链构成的的异源双链DNA(图1c)。 通过DNA修复过程,将已编辑链中的信息复制到互补链中会最终安装该编辑(图1c)。 基于我们在碱基编辑过程类似的策略,我们可以中很好地解决异源双链DNA [16-18],我们假设剪切未编辑的DNA链可能会偏向DNA修复取代未编辑的链。
Fig. 1 图d.e的条带纵坐标单位不应该是nt,因该是bp???
a,ClinVar中的75,122种已知病原性人类遗传变异(于2019年7月),按类型分类。
b,prime editing复合物中PE蛋白包含1.RNA引导的DNA切口域如Cas9酶,2.与RT结构域融合PE蛋白再与pegRNA复合。 PE-pegRNA复合物可在各种位置进行多种精确的DNA编辑。 spCas9,化脓性链球菌Cas9。
c,PE-pegRNA复合物结合目标DNA并切割含PAM的链。产生的3'端与PBS杂交,然后使用pegRNA上人工编辑的DNA序列作为模板反转录。细胞5'端经过切割和连接以及DNA修复得到稳定的DNA序列。
d,用5'-延伸的pegRNA,含有5'-Cy5-标记的PAM链,dCas9和商业M-MLV RT变体(RT,Superscript III)的预先切割的dsDNA底物进行体外引物延伸测定。dCas9与pegRNA复合,然后与所示组分一起添加到DNA底物中。1小时后,通过变性PAGECy5荧光分析反应。
e,使用与dCas9或Cas9(H840A)切口酶和的3'延伸的pegRNA合成复合物,以及预先切割或未切割的dsDNA底物,按照d中所述进行引物延伸测定。
f,在含有GFP-mCherry融合报告基因质粒转化的酵母使用pegRNA,Cas9切口酶和RT编辑。报告基因质粒在GFP和mCherry之间有无义或移码突变,该pegRNA可在移码区域通过颠换,1-bp插入或1-bp缺失恢复mCherry翻译。 GFP和mCherry双阳性细胞(黄色)说明编辑成功。 d–f中的图像代表n = 2个独立重复。有关凝胶源数据,请参见补充图1。
体外和酵母中验证
首先,我们测试了Cas9的RuvC核酸酶结构域切割含原间隔物基序(PAM)的DNA链的3'端是否可用于引发逆转录。我们通过将引物结合位点(PBS)添加到单个向导RNA(sgRNA)上来设计pegRNA,引物结合位点可让带切口的DNA链的3'端与pegRNA杂交,提供人工编辑的RT模板(图1c)。我们通过在sgRNA的一端同时添加PBS序列(5–6个核苷酸(nt))和RT模板(7–22nt)构建pegRNA,并证实5'延伸的pegRNA可使Cas9在体外与靶DNA结合。并且5'延伸的pegRNA和3'延伸的pegRNA在体外和哺乳动物细胞中都可使Cas9切割DNA(扩展数据图1a–c)。接下来,我们使用5'-Cy5标记的双链DNA(dsDNA)底物,无催化活性的Cas9(dCas9)和商业莫洛尼鼠白血病病毒(M-MLV)RT变体,测试了这些候选pegRNA与逆转录的相容性(扩展数据图1d)。当所有组分都存在时,标记的DNA链可以有效地转化为更长的DNA产物,不同RT模板的逆转录产物凝胶迁移率与理论一致(图1d,扩展图1d,e)。 缺少dCas9导致缺刻翻译产物,这是由RT介导的DNA模板在DNA模板上聚合而产生的,产物不含pegRNA信息。用传统的sgRNA代替pegRNA时,未观察到DNA聚合产物(图1d)。这些结果表明,dCas9产生的带切口的DNA能够引发pegRNA的逆转录。
接下来,我们测试Cas9(H840A)酶对未切口的含有PAM序列的dsDNA的切割。在这些反应中,5'延伸的pegRNAs不能有效地产生逆转录产物(延伸数据图1f),但是3'延伸的pegRNAs可以有效实现Cas9切口和反转录(图1e)。尽管理论上可能在pegRNA上任何地方终止逆转录,但实验中3'延伸的pegRNA只产生单个表观产物。Cas9,RT和3'延伸的pegRNA进行的反应产物DNA测序表明,完整的RT模板序列被反转录到DNA底物上(Extended Data图1g)。这些实验确定了3'延伸的pegRNAs可以在体外指导Cas9和模板共同完成逆转录。
pegRNA编码的反转录会产生3'端突出,为了在体外评估真核细胞DNA修复过程对于该突出的修复结果。我们对报告质粒进行了体外引物编辑,然后将反应产物转入酵母细胞(扩展数据图2)。我们构建了编码EGFP-linker-mCherry的报告质粒,linker中包含,+ 1或-1的移码。当在体外用Cas9,RT和3'延伸的pegRNAs编辑质粒,该pegRNAs编码一种可纠正终止密码子的颠换,37%的酵母转化子同时表达GFP和mCherry(图1f,扩展图2)。用5'延伸的pegRNA编辑的反应产生的GFP和mCherry双阳性菌落较少(9%)。3'延伸的pegRNA也能对于其他的突变进行编辑,这些pegRNA插入单个核苷酸(15%)或删除单个核苷酸(29%)以纠正移码突变(图1f,扩展数据图2)。这些结果表明,真核细胞中的DNA修复可以解析引物编辑产生的3'DNA突出,从而精确的进行颠换,插入和缺失。
引物编辑1
受观察结果的鼓舞,我们寻求开发引物编辑系统,该系统具有经可能少的组件且可编辑哺乳动物细胞中基因组DNA。我们在HEK293T细胞转入用一个质粒负责编码野生型M-MLV RT与Cas9(H840A)酶的融合体,Cas9(H840A)酶任一末端通过柔性接头与RT融合,以及另一种质粒(扩展数据图3a)编码pegRNA。最初的尝试没有检测到编辑。
将pegRNA中的PBS延伸至8–15个碱基,导致在HEK293位点3(以下称为HEK3)靶位点可检测到颠换。并且当RT与Cas9的C端融合时比融合到N末端效率更高(扩展数据图3b)。 这些结果表明,与在体外实验的相比,细胞转化的Cas9融合野生型M-MLV RT需要更长的PBS序列来编辑人细胞基因组。
我们将与Cas9(H840A)酶C末端融合的M-MLV RT称为PE1。
我们测试了PE1在pegRNA所指定的四个位点上引入颠换点突变的能力(图2a)。不同长度的PBS具有不同编辑效率,最大编辑效率达到0.7-5.5%(图2a)。 PE1在最大化每个位点编辑效率的条件下插入缺失最小,五个位点的插入缺失平均为0.2±0.1%(平均值±s.d。)(扩展图3a-f)。 PE1还在HEK3基因座上以4-17%的效率介导了靶向插入和缺失(图2a)。
这些发现表明,PE1可以直接对目标颠换,插入和删除,而无需DSB或DNA模板。
引物编辑2
我们假设工程化PE1中RT可能会提高引物编辑过程中DNA合成效率。据报道,M-MLV RT突变可增加热稳定性24、25,活性24和DNA-RNA底物亲和力26,这可以抑制RNaseH活性27。我们构建了包含各种RT突变的19种PE1变体,以评估其在人细胞中的编辑效率。
首先,我们研究了在高温下支持逆转录的M-MLV RT变体24。将D200N,L603W和T330P引入M-MLV RT(以下称为M3),与PE1相比,HEK293T细胞中五个基因组位点的颠换和插入编辑效率平均提高了6.8倍(扩展数据,图4)。
我们测试了其他RT突变,这些突变可增强与模板PBS复合物的结合,酶的合成能力和热稳定性26。分析了14个其它突变体后,在M3中添加T306K和W313F可以提高编辑效率,从而在五个基因组位点进行颠换或插入编辑时,可以将编辑效率提高1.3倍至3.0倍(扩展数据,图4)。PE1(Cas9(H840A)–M-MLV RT(D200N / L603W / T330P / T306K / W313F))的这种五突的RT在下文中称为引物编辑器(PE2)。
PE2对单核苷酸颠换,插入和缺失突变具有比PE1高得多效率,并且可以使用较短的PBS序列,这与增强的瞬时基因组DNA-PBS复合物的结合一致(图2a)。平均而言,与PE1相比,PE2导致引物编辑点突变的效率提高了1.6到5.1倍。 PE2还比PE1更有效地执行了目标插入和删除操作(图2a,图4d的扩展数据)。
Fig. 2 PE1和PE2对人类细胞中的基因组DNA进行引物编辑。
a,在PE2中使用工程化的M-MLV逆转录酶(D200N,L603W,T306K,W313F,T330P)可显着提高HEK293T细胞中五个基因组位点的引物编辑效率,并在HEK3处实现小的插入和小的缺失编辑。
b,PE2在HEK293T细胞中编辑时,RT模板长度不同时五个基因组位点效率不同。 编辑效率为包含预期编辑的读数占所有实验读数的比例,并且在所有读数均不包含插入缺失,且无分选。 平均值±s.d. 3个独立的生物学重复样本。
优化pegRNA
我们系统地测试了pegRNA结构与PE2编辑效率之间的关系。具有较低G/C含量的引物通常需要更长的PBS序列,这与切口的DNA链与pegRNA PBS杂交的能量要求一致(图2a)。无法预测PBS长度或G/C含量水平对于编辑效率的影响,这表明其它因素(例如DNA引物或RT模板二级结构)也影响编辑活性。我们建议从大约13 nt的PBS长度开始,并在优化过程中测试不同的PBS长度,尤其是当引物域G/C含量偏离40-60%时。
接下来,我们使用PE2系统评估上RT模板10–20 nt的pegRNA在5个基因组靶位点(图2b)上的作用,并在三个基因组位点使用RT模板长至31nt的pegRNA(扩展数据图5a–c)。与PBS一样,RT模板的长度也非常影响提高引物编辑效率,尽管许多超过10nt的RT模板效率差不多。某些目标位点偏好较长的RT模板(大于15 nt; FANCF,EMX1),而某些偏好较短的RT模板(HEK3和HEK293位点4,以下称为HEK4)(图2b),我们建议从RT模板10–16nt开始,并在pegRNA优化过程中测试越来越短的RT模板。
值得注意的是,使用RT模板将C放置在sgRNA支架3'的发夹附近通常会导致的编辑效率较低(Extended Data图5a–c)。我们推测C作为3'延伸的第一个核苷酸可以通过与G81配对破坏引导RNA结构,G81通常与Cas9中的Y1356形成一个pi堆栈,而与sgRNA28的A68形成一个非经典碱基对。由于许多RT模板长度都可以进行引物编辑,因此我们建议设计pegRNA时3'的第一个碱基不为C。
引物编辑系统3
来自PE2的异源双链DNA包含一条编辑链和一条未编辑链决定了长期编辑结果???。为了优化碱基编辑方法,我们先前使用Cas9切口酶对未编辑的链进行了切口,细胞用以编辑后的链作为模板16-18将DNA修复该链。为了应用到引物编辑上,我们使用PE2中已经存在的Cas9(H840A)和sgRNA测试对未编辑链切口(图3a)。由于编辑链在引物编辑过程中也被切割,我们测试了未编辑链上的各种切割位置来避免DSBs导致的插入缺失。
我们使用PE3策略,在HEK293T细胞中的五个基因组位点测试,使sgRNA离pegRNA切口位点的14-116 nt再形成切口。在测试的位点中,4/5与PE2相比,对未编辑的链进行切割可以使编辑效率提高1.5到4.2倍,高达55%(图3b)。但最佳切刻位置因基因组位点而异(补充讨论),但定位在距pegRNA诱导切口3'约40–90 bp的编辑产生切口通常可提高了编辑效率(平均41%),而没有过多的插入缺失形成(具有最高编辑效率的sgRNA的平均indels为6.8%)。我们建议从与pegRNA介导的切口约50 bp的未编辑链切口开始,如果插入缺失频率超过可接受水平,则测试其他切口位置。
在解决了编辑链突起,再对非编辑链切割能尽量避免双切口导致的DSBs和插入缺失。我们设计了一个sgRNA靶向编辑链上Cas9的spacers。
图3 | PE3和PE3b系统在未编辑的片段上切口以提高引物编辑效率。a,PE3的引物编辑概述。 在链编辑合成后,5'突出切除留下了DNA异源双链体,其中包含一个编辑链和一个未编辑链。 错配修复可解决异源双链体问题,从而产生编辑或未编辑的双链。 对未编辑链进行切口有利于错配修复该链,导致优先产生包含所需编辑的双链DNA。b,互补链切口对引物编辑效率和插入缺失形成的影响。 “无”是指PE2的对照,不对互补链切口。 c,PE2,PE3和PE3b(编辑链互补链切口)的编辑效率比较。 编辑效率为包含预期编辑的读数占所有实验读数的比例,并且在所有读数均不包含插入缺失,且无分选。 平均值±s.d. n = 3个独立的生物学重复样本。