基于线粒体功能与机器学习整合模型的急性髓系白血病预后评估及个体化治疗新策略
《Frontiers in Immunology》:Integrated bioinformatic analysis and machine learning developed a prognostic model based on mitochondrial function for acute myeloid leukemia
【字体:
大
中
小
】
时间:2025年10月24日
来源:Frontiers in Immunology 5.9
编辑推荐:
本研究通过整合线粒体基因表达数据与批量RNA测序,结合148种机器学习算法组合,首次构建了急性髓系白血病(AML)的线粒体功能相关预后评分模型(MitoScore)。该模型揭示了线粒体关键基因在T细胞亚群及AML不同发育阶段的特异性表达模式,证实高危MitoScore组预后更差,且与免疫应答、基因突变、肿瘤微环境异质性及药物敏感性(如对环磷酰胺和维奈托克更敏感)显著相关。研究建立的MitoScore列线图整合了临床变量,为AML患者的风险分层、预后预测及个体化用药提供了新型理论工具和转化方向。
急性髓系白血病(AML)的全球疾病负担持续构成重大公共卫生挑战。线粒体通过影响生物能量学、生物合成和信号通路,在肿瘤发生发展中发挥关键作用。然而,线粒体功能在AML中的预后意义和治疗价值仍需深入探索。
研究整合了线粒体基因表达数据与批量RNA测序数据,以识别与AML相关的关键线粒体基因。共采用了14种机器学习算法,产生了148种独特组合。利用性能最佳的模型开发了MitoScore,并将其与临床变量结合,建立了基于MitoScore的列线图。此外,分析了单细胞测序数据以评估关键线粒体基因对免疫细胞的影响。根据MitoScore将样本分为低风险组和高风险组,并比较了两组间的临床特征、生物学机制、拷贝数变异、肿瘤负荷、免疫浸润、免疫功能和药物敏感性。
研究从TCGA和GEO数据库获取基因表达谱和临床数据,并从MitoCarta3.0数据库筛选出1136个线粒体相关基因。通过差异表达分析和单变量Cox回归分析,最终确定了31个关键线粒体基因,这些基因同时是差异表达基因、预后相关基因且与线粒体功能相关。这些基因包括SPATA20、ELAC2、AKR7A2、IDI1、FH、PICK1、NME3、BCKDK、COA1、NDUFC1、CPT1A、DGUOK、HTRA2、CISD1、OPA3、UQCR11、MRPS12、TACO1、METTL5、HIGD2A、GLUD1、TIMM8B、SLC25A28、FDPS、FTH1、AHCYL1、CA5B、TMEM70、BNIP3、UQCR10和NFS1。相关性分析和蛋白质互作网络显示这些基因间存在强烈的共表达模式和相互作用,其中FH、MRPS12、CISD1和NFS1被识别为核心基因。
通过应用包括随机生存森林、LASSO、弹性网络等在内的14种机器学习算法的148种组合,评估了模型的预测性能。最终确定结合LASSO和RSF算法的模型为最优模型,并据此计算每位患者的MitoScore。根据中位MitoScore将患者分为高风险组和低风险组。在TCGA-AML队列以及外部验证数据集GSE37642的不同平台数据中,Kaplan-Meier生存分析均一致显示,高风险组患者的总生存期显著短于低风险组。主成分分析和t-SNE降维可视化进一步证实了基于MitoScore的风险分组能够清晰区分患者群体。
为了提升预测能力,研究构建了一个整合MitoScore与关键临床特征(包括年龄、性别、细胞遗传学风险、FAB分型)的预后列线图。校准曲线显示该列线图在预测1年、3年和5年总生存率方面具有较高的准确性。时间依赖性ROC分析表明,列线图在这些时间点的AUC值均超过0.75。决策曲线分析进一步证实了该列线图在广泛的阈值概率范围内具有显著的临床净获益。
对来自6名AML患者和6名健康对照的单细胞RNA测序数据进行分析,经过质控和整合后,获得39,783个核心细胞。通过PCA和UMAP降维,将细胞分为24个簇,并注释为7种主要细胞类型:B细胞、红细胞、粒细胞、巨噬细胞、巨核细胞、自然杀伤细胞和T细胞。与健康对照组相比,AML患者中的NK细胞和T细胞数量显著减少。对31个关键线粒体基因的表达分析发现,DGUOK、FDPS、FTH1、HIGD2A、NDUFC1、NME3、UQCR10和UQCR11在T细胞中高表达。使用AUCell算法评估细胞线粒体功能活性,发现T细胞是活性细胞群体之一,且其活性评分在AML组和健康组间存在差异。
从总细胞中分离出T细胞进行深入分析,通过UMAP聚类将其划分为8个簇,并注释为5个T细胞亚群:CD4+ T细胞、中央记忆CD4+ T细胞、中央记忆CD8+ T细胞、效应记忆CD8+ T细胞和调节性T细胞。伪时序轨迹分析揭示了T细胞的分化路径:CD4+ T细胞分化为Tregs和CD4+ Tcm,后者进一步产生CD8+ Tcm和CD8+ Tem。这显示CD4+ T细胞、CD4+ Tcm和Tregs处于发育早期,而CD8+ Tcm和CD8+ Tem则代表终末分化阶段。八个高表达的线粒体基因在伪时序轨迹上显示出动态表达模式。细胞通讯分析表明,CD4+ Tcm是T细胞亚群间通讯的关键枢纽,与CD8+ Tem、Tregs以及CD4+ T细胞之间存在频繁且强烈的相互作用。
分层分析显示,MitoScore与年龄、细胞遗传学风险分级和FAB分型显著相关,但与性别无关。重要的是,在各个临床亚组中,高MitoScore均预示着更差的总生存期,表明MitoScore是一个独立于传统临床因素的强大预后预测因子。
基因集变异分析显示,MitoScore与细胞代谢通路,特别是碳水化合物代谢、氨基酸代谢和脂质代谢密切相关。对31个关键基因的GO和KEGG富集分析表明,它们显著富集于线粒体转运、氧化磷酸化、呼吸电子传递链、线粒体ATP合成等生物学过程,以及萜类骨架生物合成、氮代谢、氧化磷酸化、产热等通路。基因集富集分析进一步揭示,低MitoScore组富集于前/后模式规范、髓系白细胞活化、免疫受体活性等通路,而高MitoScore组则富集于适应性免疫应答、B细胞介导的免疫、免疫球蛋白产生等通路。
体细胞突变分析显示,低MitoScore组中BCORL1、IDH2、MUC16和RUNX1突变频率较高,而高MitoScore组中DNMT3A、NPM1、IDH2和TP53突变更常见。拷贝数变异分析表明,低MitoScore组的复发拷贝数改变频率更高。关键基因中,TIMM8B、BCKDK、UQCR11、HIGD2A和NFS1的CNV频率最高。肿瘤突变负荷在高、低MitoScore组间无显著差异,但无论TMB水平如何,高MitoScore组患者的预后均显著更差,提示线粒体基因失调通过独立于全局突变负荷的机制驱动不良结局。
基于ssGSEA将AML样本分为两种免疫亚型:C2和C4。虽然MitoScore在不同免疫亚型间无显著差异,但在所有免疫亚型中,高MitoScore组患者的预后均显著差于低MitoScore组。免疫浸润分析发现,高MitoScore组中巨噬细胞、单核细胞和浆细胞样树突状细胞的浸润比例更高。免疫功能评估显示,高MitoScore组的抗原呈递细胞共刺激、副炎症和II型干扰素反应等免疫功能更强。此外,高MitoScore组中免疫调节因子和免疫检查点基因的表达水平也更高。
从GDSC数据库筛选药物敏感性,发现对于AML临床常用药物,低MitoScore组对5-氟尿嘧啶、吉西他滨和表柔比星更敏感,而高MitoScore组对环磷酰胺和维奈托克更敏感。此外,还鉴定出15种在两组间敏感性差异极显著的化合物,为AML的个体化治疗提供了潜在候选药物。
本研究首次系统性地构建了基于线粒体功能的AML预后模型MitoScore,并深入探讨了其与肿瘤微环境、免疫应答及治疗敏感性的关联。单细胞水平的研究揭示了线粒体基因在T细胞分化过程中的动态表达,以及CD4+ Tcm在细胞通讯中的核心作用,为理解AML的免疫逃逸机制和开发新的免疫治疗策略提供了线索。MitoScore模型整合了多组学信息和机器学习算法,展现出良好的预后预测能力和临床转化潜力,有望用于指导AML的风险分层和个体化治疗决策。
通过整合线粒体基因与批量RNA测序数据,并应用多种机器学习方法,本研究成功开发了一个新颖的AML预后模型MitoScore。该模型能够有效预测患者生存结局,并将患者分为具有不同基因突变谱、免疫特征和药物敏感性的低风险和高风险组。这项研究为AML提供了一个可靠的预后工具,并为未来的个体化治疗策略开辟了新途径。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号