结合bulk转录组和单细胞测序数据构建和验证预后模型,然后使用细胞系进行分子和功能实验对关键基因进行验证是广泛使用的文章研究方案。今天这篇文章的思路也是如此,但两个主要亮点让原本普通的套路变得不普通,只用公共数据就发到了影响因子10+的期刊。探究其中原因:第一是借用了现在红得发紫的AI进行建模,并直接把Artificial Intelligence写在了题目上。第二是在实验方面,不同于以往文章只说明关键基因可以影响肿瘤细胞的增殖、迁移等。这篇文章更进一步,用并不复杂的实验揭示了相关的分子机制,以及对临床用药和治疗的影响。今天我们就来聊聊这篇文章是怎么做的。
【文章标题】Identifying squalene epoxidase as a metabolic vulnerability in high-risk osteosarcoma using an artificial intelligence-derived prognostic index
【发表杂志】Clinical and Translational Medicine(IF: 10.6)
【发表时间】2024年1月
【关键词】Machine learning, Osteosarcoma, Prognostic model, Squalene epoxidase
闪光点
人工智能衍生的预测指数(AIDPI)是对胆固醇平衡失调的高危骨肉瘤患者进行分层的可靠生物标志物,而鲨烯环氧酶(SQLE)是影响这些患者的代谢的因素。
沉默SQLE可通过降低胆固醇和抑制FAK/ PI3K/ Akt/ mTOR通路来抑制骨肉瘤进展。
SQLE抑制剂可抑制体内骨肉瘤的进展并增强化疗效果。
构建AIDPI模型,并验证模型的预测性能
文章开头作者直接开始模型构建,我们看到题目直接写着人工智能感觉非常深奥,这里先介绍一下作者所说的AIDPI模型是怎么回事。研究后发现,人工智能衍生的预测指数(AIDPI)其实是将一系列的机器学习方法进行组合,比如我们常用的COX回归模型也是机器学习方法中的一种。在各种机器学习方法中,有些方法还具备降维或者特征选择的功能,作者就将具备降维或者特征选择功能的方法与建模的方法组合到一起,形成多种组合方法,再从中选取预测性能最好的一个组合,即为AIDPI。
在今天介绍的这篇文章中,作者选择了10种机器学习方法,包括LASSO、GBM、RSF、plsRcox、StepCox、SuperPC、ridge、Survival-SVM,CoxBoost和Enet。在这些方法中,LASSO、RSF、StepCox和CoxBoost具有降维或者特征选择的功能。通过这些方法的组合,文章得到101种建模方法(图1)。
将GSE21257-OSA和GSE16091-OSA两个队列合并为GEO-OSA队列作为训练集。将TARGET-OSA作为验证集,GSE33382-OSA作为独立测试集。结果显示CoxBoost和GBM组合建立的模型被选为最佳模型(AIDPI),因为其平均C-index(.817)是最高的(图1)。该模型由12个基因组成,验证集的AUC分别为.817、.772和.776。独立测试集的AUC分别为.886、.767和.849。进一步文章评估了AIDPI和68个以前发表的骨肉瘤标志物在不同队列中的预测能力(图2)。结果表明,AIDPI可以预测骨肉瘤患者的预后,并且优于之前发表工作的预测性能。
结合单细胞分析,进一步筛选和聚焦到SQLE基因
文章对6例单细胞测序骨肉瘤数据(PRJNA681896)进行分析,并鉴定出9个主要细胞群,包括骨肉瘤(OSA)细胞、B细胞、内皮细胞、髓样细胞、NK细胞、破骨细胞、浆细胞、基质细胞和T细胞。通过对各类型细胞之间的比较,得到各细胞群中高表达基因。用单细胞分析得到的这些基因与AIDPI建模的12个基因,以及bulk转录组样本中高、低AIDPI组间差异基因取交集。最后,文章聚焦到三个基因:CORT、MYC和SQLE(图3)。
根据canSAR数据库(https://cansar.ai/)搜索,只有MYC和SQLE编码的蛋白质具有可药用结构,可作为高AIDPI患者的潜在治疗靶点。在骨肉瘤中经常扩增的癌基因MYC已经有很多研究了,所以文章将重点聚焦于SQLE基因,其基因组位置与MYC相近(SQLE为 8q24.13,MYC为8q24.21)。通过SQLE与MYC表达相关性分析,以及bulk转录组中SQLE表达与免疫浸润相关性分析,结果表明,SQLE与MYC在DNA水平上共扩增,SQLE在骨肉瘤中的过表达可通过促进骨肉瘤细胞的化疗耐受性和抑制免疫细胞的浸润来促进骨肉瘤的进展。而且位于细胞质中的SQLE蛋白因其作为代谢酶的性质也更容易成为药物靶点。
多做两步的实验,让结果更有临床价值
为了揭示SQLE在骨肉瘤中的作用,文章在内源性SQLE蛋白高表达的MNNG和U2OS细胞系中沉默 SQLE。结果显示抑制了这些细胞的恶性表型,包括增殖、克隆形成、迁移和侵袭。此外,流式分析表明SQLE基因敲除在没有药物治疗和有药物治疗的情况下都会促进细胞凋亡(图4)。IC50表明shSQLE组可提高对MAP方案中药物的敏感性。IHC分析证实,沉默SQLE后,SQLE蛋白丰度降低,Ki-67阳性细胞减少。因此靶向SQLE蛋白可能是抑制骨肉瘤进展的一种合理方法。
大多数文章做到这里已经完美收工了,但这篇文章继续做了探究。在发现SQLE沉默对骨肉瘤的不利影响后,文章将重点转移到揭示其潜在的分子机制上。通过对shSQLE和shControl 组的U2OS细胞进行RNA测序分析,结果显示SQLE转录水平与三种PI3K/mTOR通路拮抗剂的AAC值(剂量-反应曲线上面积)呈稳健的相关关系,强调了SQLE转录水平与骨肉瘤细胞系中该通路激活之间可能存在的联系。考虑到SQLE蛋白在胆固醇合成中的作用以及胆固醇通过脂质筏在细胞信号调节中的关键作用,验证了沉默SQLE会降低细胞内胆固醇水平,进而用WB验证了FAK /PI3K /Akt /mTOR信号通路失活,最终抑制骨肉瘤的恶化(图5)。
最后一步,既然观察到了SQLE沉默对骨肉瘤的抑制作用,文章进一步探索其治疗潜力。通过细胞培养、增殖和克隆形成和小鼠实验,验证了SQLE抑制剂FR194738对骨肉瘤的潜在治疗作用,并且发现FR194738以SQLE为靶点,可以提高化疗(尤其是DDP)对骨肉瘤患者的疗效(图6)。
这篇文章中分析的主要数据都是来自公共数据库,用到的分析和实验方法也较为常规。但是借用了现在红得发紫的AI进行建模,以及更进两步的实验,将文章水平大幅提升。一篇高分文章也许不需要太多复杂炫技的方法,用简简单单的手段,结合热点和缜密的逻辑,更好的体现临床价值,就会成为一篇好文章!沃林团队会不断给你的科研带来新思路!