原文:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-1931-9
作者: runuply
介绍
体内研究对于多器官系统的功能解剖和整个生物体的生理至关重要,而实验室小鼠仍然是研究哺乳动物(尤其是人类)病理生物学的典型动物模型。
通过基因组测序,诱变和基因组编辑,表型分析和生物信息学方面的技术创新,小鼠体内基因功能和功能障碍的体内分析已使人们对疾病的机理有了新的认识,并加速了医学进步。但是,许多重大障碍限制了对罕见和复杂,多因素疾病的潜在机制的阐明,从而在科学知识上留下了巨大的空白。开发带有功能注释的基因组图谱的未来进展取决于模型生物的研究,尤其是小鼠。此外,小鼠中遗传操作和体内,体外和计算表型分析技术的最新进展使注释哺乳动物基因组内绝大多数功能元件成为可能。实施“深层基因组计划”(在小鼠中提供人类所有直系同源基因组元件的功能性生物学注释)是一项重要且可执行的策略,可以改变对人类健康和疾病的遗传和基因组变异的理解。
全面的了解遗传学,在单个位点,单个基因和整个基因组的水平上,以及病因导致的基因改变包括基因序列,RNA或者是蛋白功能的改变,这些都对于满足社会对精密医学的期望以及对于优化临床实践至关重要。小鼠和人类基因组具有超过80%的保守性和高度的基因同源性,为比较功能分析和使用转基因小鼠研究人类疾病的病理生物学提供了独特的机会。比如,在罕见病领域己经知道的有6000到8000种遗传性罕见病,其中有5000到6000个是知道致病的基因的,而且许多已经通过小鼠进行了致病基因证实研究的。然而,从基因型的角度看,人类已知的2万多个基因中70%至80%的没有与特异表现相关的基因型变异。CRISPR / Cas9已实现了小鼠基因组的快速高效靶向诱变。
体内分析和成像技术的同步发展可以精确的重复出小鼠突变的表型。
几乎所有身体系统的深表型分析,包括心血管系统,消化系统,内分泌系统,免疫系统,表皮系统,淋巴系统,肌肉系统,神经系统,感觉系统,生殖系统,呼吸系统,骨骼系统和泌尿系统都是可能的。
此外,在线计算资源(例如MONARCH Initiative(www.monarchinitiative.org))使用受控词汇来整合来自异类数据集(例如MGI,OMIM,Orphanet)的数字,文本和图像生物学信息,从而将基因型链接到表型并进行比较 在鼠标和人类本体论之间。
这些和其他进展促进了工业规模突变小鼠生产和表型的协调,其成本远低于以前将使小鼠中所有人类直系同源基因组元件的功能注释作为可实现的科学目标的想象。实现这一目标是国际小鼠表型研究协会(IMPC)工作的基础。 IMPC是由位于五大洲12个国家的20个研究实验室组成的协调计划,致力于设计,生产和描述人类基因直系同源物在小鼠基因组中的功能(www.mousephenotype.org)。
这种全球努力的规模反映了人类基因组测序项目的精神和规模。IMPC使用胚胎干(ES)细胞中的同源重组和CRISPR / Cas9技术在小鼠基因组中创建基因突变体,然后对成年小鼠和胚胎的雌性和雄性队列进行全生物表型分析。到目前为止,重点一直放在小鼠基因组中空蛋白编码等位基因的产生和表型分析上,认识到这些资源是哺乳动物基因功能的基本基线,在此基础上,其他突变的等位基因系列的产生和研究— 亚同型,新同型,反同型和超同型将繁荣并为基因-表型关系提供进一步的见解。
IMPC领导的发现研究和IMPC推动的研究揭示了与性别差异相关的人类疾病的基因关联,包括听力损失,眼病,代谢性疾病,骨病理学,发育异常等。 科学界(https://www.mousephenotype.org/data/publications)。这项工作在工业规模上继续进行,对基于基因的疾病表型和其他科学领域(例如保护和生态学)产生了新颖的见解。这种组合的小鼠产生,表型和信息学方法已被应用于约1/3的已知孟德尔疾病基因,并检测到人类疾病基因与直系同源基因的小鼠基因敲除(即无效等位基因)之间约有一半的基因具有显着的表型相似性。
测试了每种疾病至少一种临床表型的大部分基因(95%),并在整个人体系统范围内检测到了匹配。目前,IMPC已经为近9000个基因产生了空突变,其中有6000多个已经被表型化。
到2021年7月,IMPC将完成9000多个基因的综合表型注释,约占小鼠〜18,000个人类直系同源物的一半(图1)。
IMPC在其2021年至2030年的十年战略计划中呼吁扩大小鼠模型研究,以为孟德尔和多因素疾病提供精确的分子诊断和靶向治疗方法,以最大程度地对人类健康产生有益影响(https://www.mousephenotypetest.org / about-impc /)。转基因小鼠可以使用性别平衡和年龄匹配的突变小鼠队列以及适当的遗传控件进行统计学上的,随机和盲目的实验,并具有足够的敏感性和特异性,以可靠地评估与特定性状,发育,遗传背景有关的基因功能和功能障碍或其他物理和环境条件。结果,小鼠遗传学研究的规模和广度越来越多地推动使用小鼠突变体和表型数据为人类基因组诊断项目提供信息,包括美国NIH孟德尔基因组学中心(www.mendelian.org),未诊断疾病网络。 (https://undiagnosed.hms.harvard.edu/),加拿大的Care4Rare(http://care4rare.ca),Gabriella Miller儿童第一儿科研究计划(https://kidsfirstdrc.org/),英国基因组计划 (https://www.genomicsengland.co.uk/)和“基金会弊病罕见”(https://fondation-maladiesrares.org/eng/)。包括小鼠在内的动物模型数据有助于在临床测序中未知意义的变体中解释潜在的因果变体。
尽管迄今为止的大量努力已经揭示出了对整个哺乳动物基因组功能结构的更全面的了解,但是仍然存在重大和重要的知识空白,这限制了解释基因和遗传变异与人类发育和疾病之间因果关系的能力。例如,大多数已发表的基因至表型研究继续集中于已被充分注释的基因,或者已经具有生物学功能和突变的病理后果知识的基因。 结果,许多人类基因组尚未开发。
仅有约60%的哺乳动物基因组可获得小鼠突变株和相关的表型数据,
无法完全照亮黑暗基因组是对实现基因组学,临床基因组学,人类基因组计划和精密医学的全部潜能的威胁。
总体而言,新发现的疾病基因将临床外显子组测序数据的分子诊断率显着提高了近两倍。像IMPC这样的雄心勃勃的计划有意专注于几乎没有功能注释的基因的全面表型化,直接解决了黑暗基因组危机,并提供了加速人类健康影响的潜力。
在参考人类基因组上注释的〜20,000基因中,只有约21%的基因变异与人类疾病特征有关(图2)。
此外,尽管人类和动物(小鼠,大鼠,飞行,鱼类和蠕虫)的模型表型已与约80%的人类基因相关,而小鼠模型的表型与约60%的人类基因相关,但其深度和程度 每个基因的表型覆盖率通常受到限制。
至关重要的是,对于人类和模型生物而言,对多效性和多发病的认识常常是不完整的,这破坏了对基因功能和疾病机制的理解。此外,对表型异质性及其潜在的潜在遗传基础(例如,基因座和等位基因异质性,多基因座变异,修饰位点)的了解,以及对多种疾病表型在单个基因基因座上融合,年龄依赖性的外显率的了解 以及可变表达方式均受限制。 实验模型中缺乏体内功能性注释会导致较长的诊断过程,并严重阻碍了针对特定基因产物的分子实体的开发。
作者们推测,将需要国际社会的集体努力采取四个步骤来推动基因组医学和精密医学的进步。 这四个步骤与体外系统和其他模型生物的全基因组目标相关,将提供对单个基因功能的更深入,更全面的理解,使生物学资源和数据可用于实验性地破译疾病。IMPC的2021-2030年战略(https://www.mousephenotype.org/wp-content/uploads/2019/05/IMPC_Strategy_2021-30.pdf)也围绕这四个步骤制定。
蛋白质编码基因组的完整功能注释。 完全丧失功能的突变对于鉴定蛋白质编码基因的表型影响是必不可少的,并且是解释临床相关的人类遗传变异引起疾病的必要的第一步。 到2021年,根据IMPC当前的任务授权,将仍有约9000种小鼠体内直系同源基因需要由财团进行分析。 在基因组中途停止在这一点上,相当于人类基因组计划在组装了11条染色体的常染色体序列后停止了测序工作。 至关重要的是,继续努力使用小鼠模型完成对其余未注释蛋白编码基因的功能分析。
建立非编码基因组的功能评估。 整个编码区仅占哺乳动物基因组的3–5%。 其余95%的基因组在各种生物过程中扮演着许多角色,包括DNA复制,转录调控和基因组结构。 特别要注意的是,增强子,沉默子,启动子和绝缘子的变异对正常和异常基因表达和基因剂量现象都有重大影响。 为了充分探索基因组最暗部分的体内功能,必须实施对保守的非编码元件的突变进行优先排序和建模的策略。
将功能生物学知识转化为临床知识。基因组学和精密医学的新兴领域依赖于解释患者遗传变异的潜在病理生理后果的能力。除了学术和研究考虑之外,将人类遗传变异转化为功能表型和疾病机制的长期财务投资是巨大且不断增长的。预计政府机构和企业投资者的全球投资将在10年内从790亿美元增长至近2000亿美元,增长近三倍(https://bisresearch.com/industry-report/precision-medicine-market.html)。例如,来自美国所有人项目,英国生物银行,英国100K基因组计划,中国精准医学计划等项目的志愿者正在招募志愿者,以收集个人病史,临床信息,基因组序列和环境元数据,了解基因在健康和疾病中的作用,以便确定分子疗法的新靶标。为了使这些投资兑现其从分子诊断到管理和治疗干预的改善健康结果的承诺,有必要将对小鼠和其他动物模型的研究产生的基因功能数据整合到临床数据库中,例如ClinVar,ClinGen,和别的。需要继续发展模型生物数据库,并改善数据集成和分析,以使人们能够对遗传变异和疾病进行机械分析,并支持基因组和精密医学的未来发展。
实现基因组变异的快速功能评估,并将功能测试整合到临床决策过程中。虽然目前使用人类患者数据的统计推断来区分由良性相关变体引起的疾病,但通常无法获得确定的分子诊断。即使在这种方法足够的情况下,诊断的延迟也会在心理,社会和经济上造成高昂的代价。必须进行程序来快速创建和分析人类编码变体的小鼠模型以及更有效的表型分析方法。这些模型以及其他突变变体将为诊断决策和针对性治疗提供依据。有了这些程序,临床医生及其研究同事可以依靠小鼠模型作为诊断和治疗测试平台,检查直系同源哺乳动物系统中遗传变异的病理学意义,询问不同类型等位基因的基因/表型关系(例如, SNV等),探索潜在的基因/环境影响,并访问综合数据集以帮助指导临床决策。反过来,小鼠遗传学专家将需要对小鼠模型进行针对性的表型快速反应,以实现临床应用。有必要优化资金,并从小鼠功能数据中获取科学见解,以指导小鼠模型在人类患者化身中的应用,通过电子病历提供从小鼠数据中获得的知识,并加强临床医生的遗传学教育和培训和基因组医学。
尽管在单基因和基因组水平上遗传学方面取得了令人难以置信的科学进步,但是集体生物医学界才刚刚开始了解有关整个人类基因组中功能元件的多种多样的体内病理生物学作用的知识。 全球小鼠遗传学界已准备好应对面临的巨大挑战,以充分理解基因和遗传学在发育,生物体内平衡,系统生物学,疾病和医学中的作用,并准备为系统研究开启一个新时代 哺乳动物基因组的功能 现在是进行人类基因组计划规模的深度基因组计划的时候了,该计划将从根本上增强整个生物医学科学的知识基础。 在小鼠遗传学的巨大潜力的推动下,与其他模型生物和体外方法的发展相关联,该项目将为生物学,医学和全球健康带来变革。