人由细胞组成,细胞由细胞核、细胞质、细胞膜组成(特例: 红细胞没有细胞核),细胞核由核仁、核膜、染色质组成,染色体(染色质)由DNA、组蛋白(主要是这两种)组成。对于人类来说,细胞核包含23对染色体(22对常染色体+1对性染色体)。
Gene(基因),遗传的基本单元,是产生一条多肽链或功能RNA所必需的DNA片段,可以简单理解为DNA双螺旋的一截片段,其重要作用是指导RNA翻译出蛋白质。
DNA(脱氧核糖核酸),双螺旋结构,由ATCG四种碱基以一定的顺序(顺序就是遗传信息)排列而成,两条DNA单链碱基顺序互补。DNA序列很长很长,但能够表达信息的片段(表达基因)很少。
RNA(核糖核酸),以DNA单链为模板,以碱基(AUGC)互补配对为原则转录而成的一条单链(mRNA居多),主要功能是实现遗传信息(基因)在蛋白质上的表达,是遗传信息向表型转化过程中的桥梁。接着mRNA(信使RNA)在tRNA(转运RNA)等的帮助下,以氨基酸为原料合成多肽链,多肽链折叠形成不同的空间结构变成不同的蛋白质(翻译)。
Chromosome(染色体),细胞核中遗传物质(基因)的载体,主要由DNA和蛋白质组成。其中染色体并不是线性展开的,而是通过复杂的三维折叠、环绕而成的。染色质三维构象(HiC)是如今表观遗传学的热门领域,主要研究染色质三维构象的结构和功能。
综上所述,我们大致得到DNA、染色体、细胞3个层级。然而从内在角度来看,DNA反转录形成RNA,RNA翻译形成蛋白,蛋白根据特性完成不同生命功能,这里的3个层级分别是DNA、RNA、蛋白。最后从更深层次角度来看,从DNA到蛋白,是什么机制在背后控制生命体的遗传、发育,是什么命令DNA表达或者抑制,这些问题就由表观遗传学来回答。
实际上就我目前的了解,生物信息主要分为DNA、RNA、蛋白、表观遗传学4大方向。
DNA: DNA-seq
RNA: RNA-seq
蛋白: 蛋白组学
表观遗传学: HiC、ATAC-seq、CHIP-seq等