宏基因检测病原已有多篇专家共识陆续发表,管理规定相对成熟。除了宏基因技术,多重PCR扩增结合高通量测序因具有高性价比、分析速度快、灵敏度等优势在病原进行检测中具有重要地位。
设计合适的多重引物是多重PCR难点之一。primer3和SADDLE是两个设计多重引物的工具,两篇文献中均提及如下文献(2004年,IF=12.4):
primer3基于该文献计算热力学数据。因此,小编探索该文献后而有此文。术业有专攻,小编也是浅尝辄止。本文主要目的仅仅是介绍相关概念,方便读者自行研究相关文献。本文也只涉及DNA部分,RNA部分未提。
生物概念
计算自由能涉及单个碱基化学结构,因此首先简要回顾生物相关概念,便于大家阅读相关文献时知其所云。
- 核酸和蛋白组成染色体:
- 核苷酸结构如下:
- DNA二级结构包含三种螺旋,主要为BDNA螺旋:
BDNA右手螺旋和Watson–Crick碱基对:
- 影响DNA结构稳定的因素主要有如下5种:
<center>DOI: 10.1039/d0cs00594k</center>
- 以上5种因素直接影响熔链温度(Tm):
通过核酸的紫外吸收特性,可以计算出不同温度下未变性核酸的含量,从而得出Tm:
- 自由能
专业讲解可参考华中科技大学64 生物能学(1)_哔哩哔哩_bilibili。
个人理解如下:碱基互补配对为放热反应,需要消化自由能。因此,delta G为负数。放热越多,系统越稳定,delta G越小。
NN模型和二级结构
通常通过NN模型计算双链DNA(duplex)的(N表示为1个碱基)。
<center>DOI: https://doi.org/10.1038/s41467-022-29500-4</center>
上图所示,用法类似于k-mer(k=2)。将每一个的进行求和,同时包含“惩罚项”,即为最后DNA双链的。
注意:因为DNA右手螺旋性质,和的二级结构分布稍有不同,因此。详细解释可参考Nucleic Acid Structure 2 – Stability of DNA - YouTube.
DNA具有不同的二级结构,不同的二级结构计算方式不同:
后文基于上图不同的二级结构分别计算。
Watson-Crick碱基对
计算
Watson-Crick碱基对计算自由能公式如下:
delta g symmetry = +0.43 kcal/mol if the duplex is self-complementary
delta G symmetry = 0 if it is non-selfcomplementary.
10种堆积碱基(stack)自由能见下表:
作者提供案例如下:
TABLE 1是基于计算结果,不同温度下同一个stack 也不同,计算公式如下:
- 焓变()和熵变()均为热力学相关概念,单位分别为和;
- 为Kelvin温度。
计算
计算公式如下:
- CT is the total molar strand concentration,
- R is the gas constant 1.9872 cal/K-mol
- x equals 4 for nonself-complementary duplexes and equals 1 for self-complementary duplexes
此处应该指所有stack之和,即。
作者提供案例如下:
For a nonself-complementary duplex with delta H =−43.5 kcal/mol , delta S = −122.5 e.u., and strand concentrations of 0.2 mM for each strand:
计算公式有很多,最常见的怕是:
正如不同的算法有不同的适用条件,适用上述公式同样需要留意:
It is important to realize that this relationship holds only for short oligonucleotides (11–27 bases long) and is based on hybridization in 1 M Na+ (6× SSC), in the complete absence of any organic solvents. --Melting Temperature - an overview | ScienceDirect Topics.
更多计算公式可参见Melting Temperature - an overview | ScienceDirect Topics。
在多重PCR中,精确度更为重要:
poor thermodynamic predictions may be tolerated for single target PCR primer design, because even if the predicted TM is 10 inaccurate, one has the luxury of experimentally optimizing the annealing temperature. In more complicated assays, such as multiplex PCR, however, all the amplifications must occur under the same conditions and inaccuracies in TM predictions result in poor primer designs that cause failed amplifications.
--doi: 10.1146/annurev.biophys.32.110601.141800
salt correction
前文已知,溶液中的离子浓度影响DNA结构的稳定性。实际生产中,溶液离子浓度各不同。因此为了提高上述公式的准确度,可对离子浓度(主要)进行矫正:
N is the total number of phosphates in the duplex,
[Na+] is the total concentration of monovalent cations from all sources
不进行矫正。
作者提供案例:
前文中,CGTTGA/GCAACT计算delta g=-5.35 kcal/mol。假设:
0.1 M NaCl, 10 mM sodium phosphate, pH 7 (gives a total of 0.115 M Na+ because at pH 7 there are 1.5 equivalents of sodium for each phosphate) gives
下文计算delta G时,也可以以此公式进行salt correction。
mismatch
internal mismatch
duplex内部单个碱基错配计算方式同于Watson-Crick,只是基于不同的数据库:
作者提供案例:
terminal mismatch
假设错配在末端1bp或2bp,如下图:
这样的mismatch更多认为是terminal mismatch, 不是internal mismatch。teriminal mismatch使得duplex更稳定,即更小。化学反应往往趋向于更稳定的状态,因此,通常计算上图右侧的作为最终结果。
Dangling Ends
长链和短链互补配对时,长链多处的片段即Dangling Ends。Dangling Ends第一个碱基对结构稳定影响更大,因此通常只考虑第一个碱基。
Dangling Ends数据库如下:
loop
loop分为internal loop, bulge loop和hairpin loop。
30bp范围内的loop delta g数据库如下:
当loop大于30bp时,可通过以下公式推算(Jacobson-Stockmayer entropy extrapolation):
- delta G (loop-n) is the free energy increment of a loop of length n,
- delta G (loop-x) is the free-energy increment of the longest loop of length x for which there are experimental data
- R is the gas constant
hairpin loops
计算
hairpin loop长度不同,计算公式也不同。
- hairpin长度为3
- closing AT penalty = 0.5 kcal/mol
- applied only to hairpin sequences that are closed by AT.
- delta G (triloop bonus) values are given in the supplementary material. 查看附件补充
备注:2bp默认不形成hairpin loop.
- hairpin长度为4
- delta G 37 (terminal mismatch) is the increment for terminal mismatches
作者提供案例如下。假设有一段序列C<u>GCAA</u>G,delta g:
- hairpin长度大于4
计算
前文可知,watson-crick Tm计算公式为:
hairpin Tm计算公式稍有不同:
Internal loops
公式为:
A and B are the lengths of both sides of the internal loop
Bulges
- 长度为1bp时:
作者提供案例如下:
- bulge loop长度大于1
Coaxial stacking
假设有一个Coaxial stacking如下:
计算过程如下:
补充
以上结果均基于具体二级结构或比对结果进行计算。如果某核酸片段可以形成多个二级结构,可以选择最稳定的二级结构进行计算(minimum free energy)。
更多二级结构预测算法可参考RNA 二级结构预测方法_rna二级结构预测_xiaobai1_1的博客-CSDN博客。
primer3计算核酸热力学时参考该文献,primer3源码见primer3-org/primer3: Primer3 is a command line tool to select primers for polymerase chain reaction (PCR). (github.com)。