无意中看到有人分享读《基因调控的机制》这本书的笔记,感觉很有趣,所以就去把原书也读了一下,顺便也全文翻译了一下,虽然大部分的内容和概念我读文献已经比较熟了,而且这本书起码有接近7年了,但是感觉这么系统的整理还是有助于自己的回忆和梳理人类对于转录和调控的机理。因为查了一下还是有人翻译过的(不过京东淘宝看了看起码要两百大洋,鉴于可能的版权问题,全文是只发在我没人知道的公众号作为自己的学习用),所以这里只发一些个人的一些笔记和作者一些概念总结。
springer读书笔记
什么是基因表达?
由于其在生命的几乎所有方面都发挥着核心作用,基因表达被编程在三个不同的水平上:
DNA编码:
第一层以人类基因组序列为代表,由大约 200,000 个外显子组成的 DNA 编码,即需要转录和组合形成成熟 mRNA 分子的编码序列部分。此外,人类基因组还编码大量 ncRNA 的序列,其中大部分可能用于微调和反馈控制从染色质可及性到蛋白质翻译的基因表达 .每个基因的第一个外显子的 5'-末端标记了 TSS。尽管 TSS 区域没有任何特定的共有序列,但它们有时以基础转录因子 TATA 盒结合蛋白 (TBP) 的结合位点为特征,也称为 TATA 盒,位于 TSS 上游约 30 bp。
此外,目前已知的 3200 个 DNA 结合转录因子(由大约 1600 个不同基因编码)的数百万个结合位点分布在整个基因组中,无论这些是基因间区域、内含子还是外显子。根据它们的功能和位置,这些转录因子结合位点聚集的区域被称为启动子、增强子、LCR、沉默子或绝缘子。
表观遗传编码:
大多数基因组 DNA 都被紧密排列的核小体覆盖,即转录因子和 RNA 聚合酶无法读取。因此,基因表达的第二级控制由表观遗传密码决定,该密码是组蛋白密码和 DNA 甲基化规则的组合。与 DNA 密码一样,表观遗传密码也是可遗传的,但与 DNA 密码相比,它还能够“记住”个体一生中的重大事件,例如胚胎发生期间的饥荒时期。表观遗传密码程序严格控制转录因子结合位点的可及性,并为区分基因组的活跃区域和非活跃区域留下了标记。
转录因子程序:
基因表达的第三级控制由在给定细胞中表达的转录因子的相对量和活性状态表示。转录因子的表达受DNA密码和表观遗传密码的控制。此外,大多数转录因子的活性受到许多不同过程的调节,例如磷酸化、配体结合、二聚化和易位)。转录因子通常是信号转导级联的终点,因此它们是细胞任何类型扰动的核传感器。它们不仅与其特定的 DNA 结合位点(称为响应元件 (REs))结合,而且在它们自身之间形成同源二聚体和异源二聚体,并与辅因子蛋白相互作用。这些辅因子代表了一个大家族的衔接蛋白,它们提供了 DNA 结合转录因子、RNA 聚合酶和染色质修饰酶之间的多种接触可能性。此外,辅因子与信号转导级联直接接触,因此能够感知细胞外和细胞内信号。
关键概念
分子生物学的中心法则表明了从 DNA 到 RNA 再到蛋白质的信息流的明确方向。
• 基因表达决定了人体所有 400 种组织和细胞类型的功能和结构,即表型。
• 基因表达模式是给定组织或细胞类型的特征,但在暴露于信号或响应病理条件后会发生显着变化。
基因表达的第一步,即基因组DNA 的转录,是控制和调节的主要点。
RNA 聚合酶 I 和 III 合成大量数量有限的必需管家 RNA,例如 rRNA 和 tRNA。
Pol II 转录所有蛋白质编码基因和大多数 ncRNA,例如 miRNA。它的活动受到严格监管。
除了与 TSS 的距离不同外,启动子、增强子、LCR、沉默子和绝缘子之间没有区别。它们都是聚集特定转录因子结合位点的基因组 DNA 延伸。
所有调节蛋白结合基因的 TSS 区域呈高斯分布,即找到活性转录因子结合位点的概率在 TSS 的上游和下游均对称下降。
基因组DNA 的默认状态是紧密包装在染色质中,转录因子无法访问。
对于染色质开放,一组染色质修饰酶必须去除抑制染色质的标记,并用活性染色质的标记代替它们。
基因表达在三个不同的层次上进行编程,即DNA 密码、表观遗传密码和转录因子程序。