内容速览:
蛋白质作为基因表达的重要产物,在生物的生命活动中起着重要作用。而在生物体的众多的蛋白质中,转录因子又处在了尤为重要的位置。
转录因子是一类可以对基因转录进行调控的蛋白质,通过直接或间接与基因启动子区域中顺式作用元件发生特异性相互作用,增强或减弱RNA聚合酶活性,从而促进或抑制基因的表达,在生物体生长发育、信号转导、生物和非生物胁迫响应方面发挥重要作用。
一、转录因子研究背景
典型的转录因子一般具有四个功能结构域:
DNA结合区(DNA-binding domain,DBD):转录因子识别结合顺式作用元件的一段氨基酸序列,能够与靶位点专一性结合。
转录调控区(transcription regulation domain,TRD):可分为转录激活域(activation domain,AD)和转录抑制域(repression domain,RD),决定着转录因子对靶基因的调控特征(转录激活/转录抑制)。
寡聚化位点区(oligomerization site,OS):不同转录因子间发生相互作用的区域。多数转录因子需要形成蛋白二聚体或多聚体作为表达调控复合物,直接或间接地结合DNA序列,进而调节下游基因的转录过程。
核定位信号区(nuclear localization signal,NLS):负责将转录因子从细胞质运输到细胞核。
转录因子可以分为普遍转录因子和组织细胞特异性转录因子两类。普遍转录因子与RNA聚合酶组成转录起始复合物,广泛参与细胞内DNA转录过程。组织细胞特异性转录因子在特定类群细胞中表达,受到某些细胞信号分子刺激后,参与特异性蛋白质表达的转录过程。
近年来,随着转录因子相关研究的逐步深入,其分析方法也在持续创新。为了帮助大家系统了解转录因子研究策略,我们将从四个主要方面展开阐述:转录因子的发现与鉴定、转录因子的功能验证、靶基因与转录因子互作,以及转录因子与其他蛋白互作。鉴于内容较多,本期小源将率先带领大家深入探究前两个方面,一同开启这场知识探索之旅。
二、转录因子的筛选
当没有目标的转录因子时,我们首先需要通过实验筛选目标转录因子,常用的方法比如利用高通量测序、生信预测或依据文献数据。
1、转录组测序(RNA-seq)
RNA-seq是一种利用高通量技术对组织或细胞中的所有RNA进行测序,从而快速获得特定细胞或组织在某一状态(处理)下的几乎所有转录本的序列信息和表达信息。通过RNA-seq可以筛选出特定生物学过程中表达发生变化的转录因子,为后续的功能研究提供候选基因,同时可以预测转录因子的潜在结合位点,进而构建基因调控网络。
在2024年发表的研究论文“Integrated transcriptomic and CGAs analysis revealed IbGLK1 is a key transcription factor for chlorogenic acid accumulation in sweetpotato (Ipomoea batatas [L.] Lam.) blades”中,作者利用RNA-seq分析结合代谢检测数据,分离鉴定了与绿原酸合成和代谢高度正相关的基因g54469,该基因编码转录因子 IbGLK1。
在2024年12月发表的文献“Integrated metabolomic and transcriptomic analysis reveals the role of root phenylpropanoid biosynthesis pathway in the salt tolerance of perennial ryegrass”中,作者为探究多年生黑麦草(Lolium perenne)根部的酚丙烷生物合成途径在盐胁迫耐受性中的作用,利用RNA-seq技术对盐敏感型品系P1和盐耐受型品系P2的多年生黑麦草在盐胁迫条件下的差异表达基因进行了分析,并利用生物信息学分析将差异表达基因与植物转录因子数据库 (PlantTFDB v 5.0)进行了比对,成功鉴定出其中共有21个家族,236个基因为转录因子。
2、ATAC-seq/DNase-seq
DNA的甲基化、组蛋白修饰、核小体重塑、转录因子作用均会导致染色质结构发生改变。ATAC-seq、DNase-seq、MNase-seq以及FAIRE-seq均是在表观遗传学层面,通过分析染色质三维结构的开放、闭合,来分析基因表达调控的技术,能够快速、灵敏地识别出基因组上哪些区域的染色质结构较为松散,从而使DNA更容易被蛋白质因子如转录因子结合。ATAC-seq/DNase-seq通常会与RNA-seq联用,确定目标转录因子,也会和CHIP-seq联用,来寻找下游调控靶基因。
2022年发表的题为“Integrating ATAC-seq and RNA-seq Reveals the Dynamics of Chromatin Accessibility and Gene Expression in Apple Response to Drought”研究论文,通过ATAC-seq检测了干旱处理和未处理条件下,苹果幼苗的染色质开放程度变化,找到染色质可及性较高的基因,并通过结合RNA-seq数据,找到基因表达量增加的基因,共240个基因,其中鉴定出9个转录因子,表明这些位点可能通过调节下游基因参与苹果对干旱条件的响应。
郑州大学/中国农业科学院棉花研究所2023年7月在New Phytologist发表研究论文“Characterization of chromatin accessibility and gene expression reveal the key genes involved in cotton fiber elongation”,通过ATAC-seq技术检测短纤维突变体ligon linless-2 (Li2)与野生型(WT)的染色质可及性并结合RNA-seq数据,揭示关键调控基因。
ATAC-seq得到的差异染色质开放性区域,通过联合RNA-seq数据分析,在短纤维突变体ligon linless-2 (Li2)鉴定了6个差异表达的TF,并结合生信分析预测靶基因。
3、生信分析
在同种类型的转录因子中,DNA结合区具有相同的保守结构域,如MYB结构域、锌指蛋白结构域、WRKY结构域、bZIP结构域、AP2/EREBP结构域、MYC结构域等。这些保守结构域(conserved domains,CD)使得用生物信息学方法进行转录因子的预测和功能鉴定成为可能。
常用的大型生物学数据库NCBI、EBI和DDBJ等都能提供植物转录因子的相关数据。另外还有许多转录因子的专用数据库,如:
TRANSFAC 是关于转录因子在基因启动子上结合位点的数据库。
PlnTFDB 是系统收录植物转录因子的数据库。
JASPAR是一个用于预测转录因子与DNA序列的结合区域的网站。
PROMO是一个用于鉴定DNA序列中假定的转录因子结合位点的预测网站。
获取基因的启动子序列:首先,需要从NCBI(National Center for Biotechnology Information)获取目标基因的启动子序列。通过NCBI的Gene数据库,输入基因名称并搜索,找到目标基因后,确定其在基因组中的位置,并计算启动子区域。一般认为基因起点上游2000bp的序列为潜在的启动子区域。
使用数字化核酸-蛋白对接进行转录因子预测:将获取的启动子序列输入数字化模型(如:JASPAR)预测可能与之互作的转录因子。
4、酵母单杂交技术
当有目标的DNA顺势作用元件时,我们可以利用酵母单杂来筛选与之互作的转录因子。酵母单杂交技术是在酵母双杂基础上发展而来的一种研究核酸-蛋白相互作用的工具,被广泛用于研究真核细胞内基因的表达调控,如鉴别 DNA 结合位点发现潜在的结合蛋白基因。在小源之前的文章【科研必备】转录因子的“密码本”——玉米全长转录因子文库中我们提到了可以利用转录因子文库去筛选与感兴趣的DNA(顺势作用元件序列)存在相互作用的转录因子。
2024年发表的研究文章“The transcription factor Dof3.6/OBP3 regulates iron homeostasis in Arabidopsis”,研究为探究拟南芥铁稳态的调节机制,将缺铁响应基因bHLH100 启动子的截短片段作为诱饵,利用酵母单杂交技术筛选拟南芥转录因子文库,鉴定出多个家族的转录因子与bHLH100 启动子的截短片段存在互作,并选择其中感兴趣的DOF 家族转录因子OBP3进行了后续研究。
三、转录因子的鉴定
1、亚细胞定位
转录因子参与细胞内DNA转录的起始与调控,直接或间接响应信号通路转导。其中,部分转录因子存在细胞核质定位的改变,在细胞质与细胞核中发挥不同的功能或活性。转录因子的结构通常包含多个功能区域,其中核定位信号是其中一个重要的组成部分,它负责调控转录因子进入细胞核的过程。转录因子需要在细胞核内才能与DNA结合,从而发挥其调控基因表达的功能,因此核定位信号对于转录因子的功能实现至关重要。
上文中提到的研究论文“Integrated transcriptomic and CGAs analysis revealed IbGLK1 is a key transcription factor for chlorogenic acid accumulation in sweetpotato (Ipomoea batatas [L.] Lam.) blades”在鉴定了基因IbGLK1 后,利用亚细胞定位确认了IbGLK1 的荧光信号仅位于细胞核,并在后续研究中利用双荧光素酶报告基因体系验证了其转录激活活性。
2、转录激活活性检测——酵母体系、双荧光素酶报告基因
酵母体系:单独的BD(DNA结合域)可以与GAL4上游活化序列UAS结合,但不能引起转录。当一个具有转录激活活性的转录因子构建到BD载体上时,其表达产生的诱饵蛋白与UAS结合后能够引起下游报告基因的转录和表达。通过下游报告基因的转录和表达情况,可以判断转录因子是否具有转录激活活性。
双荧光素酶报告基因:既可以检测转录激活因子也可以检测转录抑制因子。将待测转录因子与GAL4结合域构建在同一载体上,与含有GAL-TATA转录调控原件并带有荧光虫荧光素酶(Firefly luciferase)的表达载体共转,使这段序列调控luciferase的转录表达。通过检测荧光值的高低可以判断转录因子是否具有转录激活或者转录抑制作用。
近日发表的研究论文“Functional study of ZmHDZ4 in maize (Zea mays) seedlings under drought stress”,为探究ZmHDZ4 的功能,通过亚细胞定位确定其核定位,又利用酵母体系将构建的 pBD-GLA4-ZmHDZ4 载体转化到酵母菌株 AH109 中,具有 pBD-GLA4-ZmHDZ4 和 pGAL4 (阳性对照) 的转化体在 SD/-Trp、SD/-Trp/-His/-Ade 和 SD/-Trp/-His/-Ade/X-gal 上生长良好,SD/-Trp/-His/-Ade/X-gal 上的菌落表现出半乳糖苷酶活性。相比之下,携带阴性对照 (pGBKT7 空载体) 的酵母细胞仅在 SD/-Trp 培养基上存活。这些发现最终证明 ZmHDZ4 是一种具有转录激活活性的转录因子。
四、转录因子的功能验证
1、过表达/敲除
通过过表达/敲除某基因,可以推测该基因的功能。
基因过表达技术涉及将目标基因导入生物体或细胞中,使其表达水平高于正常状态,从而研究基因过量表达对生物体或细胞的影响。这种技术可以用来研究基因的功能,尤其是在确定基因的增效作用时非常有用,通常利用构建好的转录因子过表达载体,稳定的转入所研究的物种中,获得转基因苗。
基因敲除技术则是通过使生物体基因组中的某个或某些特定基因失去功能来研究基因的功能。这通常依赖于基因编辑工具,如CRISPR-Cas9。
研究文章“CaNAC76 enhances lignin content and cold resistance in pepper by regulating CaCAD1”通过亚细胞定位及转录激活活性测定确定了CaNAC76 是一个转录因子后,利用基因沉默技术,通过沉默CaNAC76 基因以及在拟南芥中过表达 CaNAC76评估了CaNAC76 对低温的响应。
2、RT-qPCR
实时荧光定量PCR (real-timefluorescent quanti tative polymerase chain reaction, qRT-PCR)是在普通PCR的基础上增加荧光染料或荧光探针,对PCR扩增反应每个循环产物实时检测荧光信号,随着PCR产物的不断积累,荧光强度也随之增强,从而实现对起始模板的定量及定性分析,RNA-seq的准确性可以通过qRT-PCR来进行验证。
上文中提到的文章“Integrating ATAC-seq and RNA-seq Reveals the Dynamics of Chromatin Accessibility and Gene Expression in Apple Response to Drought”,作者通过ATAC-seq和RNA-seq联合分析筛选到差异表达的转录因子后,为了验证上述结果的可靠性,作者对一些具有染色质可及性变化的差异转录因子进行了RT-qPCR验证。RT-qPCR结果与转录组数据的趋势一致,进一步证明了这些转录因子对干旱的响应。
五、小源总结直通车
小源着重从转录因子的筛选及鉴定、转录因子功能验证这两个方面进行了详细阐述,希望能帮助大家对转录因子有更系统的认识和理解。
下期小源将继续带大家深入了解剩下的两部分内容(靶基因与转录因子互作、转录因子与其他蛋白互作),会有更多有趣又实用的知识等待大家~如果您觉得本次推文对您有帮助,别忘了关注我们,这样就能第一时间收到下次推送的消息啦,小源期待和大家再次相遇哦~