任务: gfr和lkb1的突变情况,在nsclc里面,包括tcga和ccle
一. 背景介绍:
EGFR是原癌基因c-erbB1的表达产物,是表皮生长因子受体(HER)家族成员之一。该家族包括HER1(erbB1,EGFR)、HER2(erbB2,NEU)、HER3(erbB3)及HER4(erbB4)。HER家族在细胞生理过程中发挥重要的调节作用。
EGFR表达于正常上皮细胞表面,而在一些肿瘤细胞中常过表达,EGFR的过表达和肿瘤细胞的转移、侵润、预后差有关。EGFR下游的信号转导通路主要有两条:一条是Ras/ Raf/ MEK/ERK-MAPK 通路,而另一条是PI3K/Akt/mTOR通路。
EGFR突变:EGFR酪氨酸激酶区域的突变主要发生在18-21外显子,其中19和21号外显子突变覆盖突变的 90%。
人LKB1(Liver kinase B1)基因或称STK 11(Serine-Threonine Kinase 11,STK 11),定位于人染色体19p 13 .3的位置。含10个外显子,编码蛋白LKB1由433个氨基酸组成, 分子量约50 kda,包括激酶区域(44~309 ) ,N 端调节域和C 端调节域。N 端调节域含一个核定位序列, 使LKB1定位于细胞核中。LKB1 在人体多种组织中广泛表达。 以幼肝,睾丸,小肠和骨骼肌最多。
LKB1基因的胚系失活突变可导致癌症易感病皮杰氏综合征(Peutz-Jeghers syndrome, PJ S) , 该病患者多发错构瘤息肉且患癌症风险增加。LKB1基因的体细胞突变广泛地存在于众多类型的恶性肿瘤中, 如肺癌。结肠癌和乳腺癌等, 因此,LKB1被普遍认为是抑癌基因。LKB1基因的编码产物LKB1蛋白是一种丝氨酸/苏氨酸激酶, 调节多种细胞生理病理过程。
LKB1的直接底物包括AMPK(AMP-activated protein kinase)和十二种AMPK激酶。LKB1通过促进AMPK α亚基上Thr172位点的磷酸化,增强AMPK的磷酸化水平,从而使AMPK激活。
二. cBioPortal突变查询
cBioPortal网站整合了126个肿瘤基因组研究的数据,包括TCGA和ICGC等大型的肿瘤研究项目,涵盖了两万八千例标本的数据,此外部分样品还包括了临床预后等表型的信息。cBioPortal的基因组数据类型包括体细胞突变,DNA copy-number alterations(CNAs),mRNA和miRNA表达,DNA甲基化,蛋白质富集,磷酸化蛋白富集。
- 首先登陆cBioPortal for Cancer Genomics官方网站http://www.cbioportal.org/,
-
现以EGFR和LKB1的在肿瘤中的突变情况例进行检索,界面的左上角有查询界面和数据下载两大功能,选择TCGA Pancancer Atlas Studies和Cell lines;
-
可同时输入多个基因名称,以空格隔开即可,系统会检验你输入的基因名称是否正确或者数据是否存在这个基因的表达,出现绿色标签“All gene symbols are valid”,说明你输入基因正确。此处我们选择了突变和拷贝数变化,填入需要查询的数据集EGFR和LKB1,此处LKB1换成STK11。
4.查询结果如下,基因在肿瘤病人中的基因改变类型的比例情况;提交后得到下图结果:
放大显示界面:
在Oncoprint标签页里面,不同的图例代表不同的突变类型,此外,还能把变异比对到具体的蛋白结构域,并且配有蛋白三维结构的图(Mutations标签页)。关键是可以调整显示的方式和图形的大小,最终还能导出不同格式的图,满足各位发表文章的需要。网址
图形解释可以查看生信菜鸟团使用可视化工具MutationMapper来看看基因上面突变的分布
http://www.bio-info-trainee.com/category/cancer/page/2
CN Segements
EGFR在各种癌症中的总结:
单独查询在CCLE中的突变:
添加热图:
cBioPortal for Cancer Genomics: EGFR in Prostate (TCGA PanCan) and 31 other studies
mRNA表达分析
在肺癌中的变化:
箱式图
点开“co-expression”,可查看EGFR基因和其他相关基因的共表达分析情况,基于基因的表达量计算特定基因与其他每个基因的相关系数,相关系数越大证明两者之间关系越密切(正数代表正相关,负数代表负相关),越有可能是上下游作用关系,通过这个信息我们就能快速锁定下游的相关分子和通路了。选择相应的基因,右边会出现表达正相图:
EGFR调控网络和药物反应
对于调控网络cBioPortal通过基因互作数据库,例如PID、PANTHER、Reactome等数据库寻找与候选基因相关联的基因,然后通过互作强弱分析构建调控网络。此外,利用DrugBank、KEGG Drugs和Cancer Cell Line Encylopedia等药物反应数据库,针对相关的药物靶向的基因进行标注,从调控网络的角度指导分子互作和药物反应实验。
三. 细胞突变基因研究CCLE(CancerCell Line Encyclopedia)
网址:https://portals.broadinstitute.org/ccle,里面包含了很多癌细胞系的基因表达和突变的信息,需要注册账号。
EGFR mRNA表达信息
EGFR 拷贝数变化
EGFR 突变信息
四、临床样本突变数据库InternationalCancer Genome Consortium (ICGC)
网址:https://dcc.icgc.org/,在里面可以查询自己想要查询的基因在临床样本里的突变情况。打开主页,可进行快速搜索,也可以高级搜索。
EGFR药物:
EGFR突变结构:
ICGC Mutations图:
五.其他数据库COSMIC(Catalogueof Somatic Mutations in Cancer)
网址https://cancer.sanger.ac.uk/cell_lines,这个数据库细胞系没有CCLE那么全,但功能比CCLE多,不仅能查询细胞,还能查询突变基因的一些其他相关信息。
在下面红框内选择细胞类型,例如A549.
EGFR的突变信息
参考资料:
- 使用可视化工具MutationMapper来看看基因上面突变的分布
- 生信菜鸟团TCGA知识http://www.bio-info-trainee.com/category/cancer/page/2
- 肿瘤里的基因突变数据库,你知多少?http://www.sohu.com/a/253612170_652735
- 肿瘤基因组学数据库终结者:cBioPortal---转载
- 功能超强大的免费肿瘤数据库—cBioPortal
http://www.geneseed.com.cn/page464?article_id=413 - cBioportal中文教程https://cloud.tencent.com/developer/article/1332367
- 使用cBio Cancer Genomics Portal综合分析癌症基因和临床资料https://www.howsci.com/integrative-analysis-of-complex-cancer-genomics-and-clinical-profiles-using-the-cbioportalal.html
- TCGA数据库在线使用http://www.360doc.com/content/17/0827/13/33204118_682489684.shtml
- 下载cBioPortal中的文章相关数据http://www.bioinfo-scrounger.com/archives/660