最近开始分析vcf文件, 于是去搜了相关VCF格式解读的博客.
大部分关于这两个指标的解读如下,都是描述质量值的,但也没说具体啥区别.
QUAL:Phred格式(Phred_scaled)的质量值,表示在该位点存在variant的可能性;该值越高,则variant的可能性越大;计算方法:Phred值 = -10 * log (1-p) p为variant存在的概率; 通过计算公式可以看出值为10的表示错误概率为0.1,该位点为variant的概率为90%。
GQ:基因型的质量值(Genotype Quality)。Phred格式(Phred_scaled)的质量值,表示在该位点该基因型存在的可能性;该值越高,则Genotype的可能性越大;计算方法:Phred值 = -10 * log (1-p) p为基因型存在的概率.
于是我专门查了下这两者的区别.下面是相关的解答.
深度截图_选择区域_20200424151428.png
个人理解是: QUAL是指变异位点,而GQ是指特定样品的GT。
- QUAL告诉您我们对给定站点中是否存在某种变体充满信心。该变化可以存在于一个或多个样本中。
- GQ告诉您我们对分配给特定样品的基因型正确的信心有多大。它仅是第二低的PL,因为它是第二低的PL与最低的PL之间的差(始终为0)。
也就是QUAL是针对该位点的,和样本无关.只是说明这个位点存在变异的可能性.而GQ是和样本相关的,它表示该样本基因型的可能性.