NGS基因检测Panel的探针设计

 背景

       目前市面上的肿瘤靶向用药基因检测Panel已非常常见,除了直观层面的gene种类、数目、捕获建库方法的不同外,对于肿瘤panel, 探针定制之初相关的MSI位点、融合断点等设计,直接影响着同一个Panel下每一批探针的实际检测效果。在探针设计层面,简单直接的办法就是确定gene列表后,直接外包探针定制公司代为设计或者自行在开源网站上设计优化:

优势:所有gene全外显子覆盖,简便高效;

弊端:对于中小型Panel,探针大小处于临界值的情况不容易控制;遗漏掉内含子区域的有害突变;外显子比例偏低的重要基因的CNV检测的准确性会受到影响;对于肿瘤用药检测Panel,MSI位点跟融合断点通常不在外显子区间中,需要额外补充;测序成本较高--以TMB相伴而生的大Panel为例,市面上500个gene左右的大Panel,若所有gene采用全外显子设计,探针大小普遍超过2Mb,在cfDNA样本低频突变要求的高深度测序模式下,即便10000X的原始测序深度,也需要20G以上的数据量,单测序费用就超过1000RMB,同时也延长了数据分析时间及交付周期。

为此,我们提出一种:结合Clinvar、COSMIC等数据库,对重点gene和非重点gene区别对待,以有害或可能有害突变分布密度为单位的选择性设计方案:

方法

以有害突变区间密度为单位的Panel设计流程

具体步骤:

SNV/INDEL部分

step1. 在Suredesign等软件上获取候选gene  list对应基因组版本的外显子+3‘/5’UTR区间信息,同时根据用药、检测内容等信息确定候选gene list中的核心gene与非核心gene;

step2. 使用STIF、Polyphen2等主流突变有害性预测软件对COSMIC、Clinvar数据库中的全部位点进行注释,设定判断条件获得原始有害候选位点集合,进一步将候选集和按exon、UTR、intron等注释信息分类;

step3. 将step2得到的exon+UTR区域的有害位点信息mapping回step1得到的染色体区间,根据落入各区间的有害位点数目及区间长度得到有害位点分布密度;

step4. 结合step1确定的核心gene及非核心gene集合,设定对应的有害位点分布密度cutoff值,确定需要保留exon+UTR区域后,再引入intron等区域的有害位点;

CNV部分:

结合step1确定的gene exon区间总长、NCBI等数据库收录的gene全长信息,计算该gene全外显子区域占比,若比例过低,则需随机引入内含子区间作为补充,如果有文献明确报道其CNV区域,也可直接引入文献报道区间。

融合/微卫星部分:

融合断点以及微卫星位点一般都不在exon区域,需要结合文献、数据库及同行同类产品收集整理并引入。

汇总迭代:

合并SNV/INDEL、CNV、融合/微卫星部分的基因组位置信息,结合探针区间的目的大小,迭代优化。

查遗:

1. 在终版探针定出之前,对TERT基因 promoter等特殊位点以及EGFR靶向用药相关突变、FGFR融合断点等重要位点进行查遗确认。

升级:

对于大panel: 如果对TMB与WES的相关性更关注,可以进一步根据目的癌种的不同,从SNV/INDEL的区间中迭代计算,选取与目的癌种spearman相关系数最高的区间,作为TMB计算的候选区域。  

 ***注意软件版本及参数更新对默认区间的影响:以AKT1基因为例:

不同参数下区间比较
UCSC区间确认

原因:2020年7月份上线的基于机器学习方法进行探针区间优化的“Select Optimized Probes” 默认参数,对AKT1基因来讲,虽然可以减少34%的探针数目和24%的区间,有效降低了探针合成与定制成本,但这个功能目前是存在bug的,会遗遗漏exon末端区间,而有些是包含重要用药信位点的,导致下一步用默认的“Coding Exons”参数却并不是真正的外显子设计!

解决办法:

1.需要控制区间大小——上一步改回原来的“Design new probes by tiling genes or regions”参数;

2. 关注UTR区域——选择Coding Exons + UTRs参数;

3. 在探针定出后发现bug——适当延长原bed文件中每个外显子的上下游区间,以回收部分遗漏区域。

建议每批探针设计完成后,随机挑选重要基因或重要区域,在UCSC上加一步确认,以避免因更新优化引入的新bug!

讨论

1.市面上各家肿瘤基因检测公司的产品,尤其是拼基因数目的大Panel,有多少是真正的所有gene全外显子设计?

2、对肿瘤患者及药企伴随诊断而言,所有gene外显子全部引入的设计模式性价比?

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,294评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,780评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,001评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,593评论 1 289
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,687评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,679评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,667评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,426评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,872评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,180评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,346评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,019评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,658评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,268评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,495评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,275评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,207评论 2 352