
-
生物通官微
陪你抓住生命科技
跳动的脉搏
线粒体相关基因在肝细胞癌预后中的作用:基于机器学习的预后模型构建与药物预测
【字体: 大 中 小 】 时间:2025年07月27日 来源:Discover Oncology 2.8
编辑推荐:
本研究针对肝细胞癌(HCC)预后标志物缺乏的临床难题,通过整合MitoCarta线粒体基因数据库与GEO转录组数据,采用加权基因共表达网络分析(WGCNA)和113种机器学习算法组合,构建了基于PSMD4、TBCE等15个线粒体相关基因的HCC预后模型(AUC=0.977),并预测氟西汀和帕罗西汀为潜在治疗药物。该研究为HCC的精准诊疗提供了新型生物标志物和靶向治疗策略。
肝细胞癌(HCC)作为全球第六大高发恶性肿瘤,其死亡率高居癌症相关死亡的第三位。尽管手术切除和靶向治疗取得进展,但耐药性、高转移率和复发率仍是临床面临的重大挑战。更令人担忧的是,代谢风险导致的HCC发病率自1990年以来持续攀升,给全球公共卫生体系带来沉重负担。在此背景下,北京中医药大学第三附属医院针灸微创肿瘤科的研究团队将目光投向了线粒体——这个被称为"细胞能量工厂"的细胞器。越来越多的证据表明,线粒体功能障碍通过影响细胞代谢、氧化应激和细胞命运决定,在HCC的发生发展中扮演关键角色。
为破解这一科学难题,研究人员开展了一项创新性研究。他们系统整合了MitoCarta数据库中1136个线粒体相关基因与GSE54236、GSE76427和GSE84402三个HCC转录组数据集,采用加权基因共表达网络分析(WGCNA)锁定关键模块基因,并创新性地评估了113种机器学习算法组合的预测效能。通过分子对接和分子动力学模拟,不仅构建了高精度预后模型,还发现了潜在的治疗药物。这项重要研究成果发表在《Discover Oncology》期刊上。
研究主要采用四大关键技术:1)基于GEO数据库的差异表达基因分析;2)WGCNA共表达网络构建;3)12种基础机器学习算法组合的113种预后模型评估;4)CIBERSORT算法解析免疫微环境特征。此外,通过DGIdb数据库预测靶向药物,并采用AutoDock和GROMACS进行分子对接与动力学模拟验证。
3.1 DEGs鉴定与验证
通过"sva"包消除批次效应后,PCA分析确认GSE54236和GSE76427数据集成功合并,共鉴定1776个差异表达基因(DEGs)。

3.2 WGCNA识别关键模块
WGCNA分析发现MEmagenta模块与HCC相关性最强(r=-0.16, P=0.004),包含450个模块基因。

3.4 机器学习筛选诊断标志物
StepGLM+GBM模型表现最优(AUC=0.985),筛选出15个关键基因,其中PSMD4(AUC=0.888)、TBCE(AUC=0.879)和CKS1B(AUC=0.860)诊断价值突出。

3.7 免疫浸润分析
CIBERSORT揭示M1/M2巨噬细胞在HCC中的核心作用,FABP1与B细胞显著正相关(r=0.73),而TBCE与树突状细胞负相关(r=-0.70)。

3.9 分子对接验证
氟西汀与AP1S1结合能达-6.2 kcal/mol,氯米帕明与FABP1结合能为-7.77 kcal/mol,均形成稳定氢键。

这项研究开创性地构建了线粒体相关基因的HCC预后模型,其创新性体现在三方面:首先,首次系统评估113种机器学习算法组合在HCC预后建模中的性能;其次,发现线粒体基因通过调控巨噬细胞极化(M1/M2)影响肿瘤微环境;最后,预测抗抑郁药氟西汀和氯米帕明为潜在治疗药物,为药物重定位提供新思路。
研究也存在一定局限性:缺乏功能实验验证关键基因的生物学机制;临床样本的病理特征信息不足;预测药物的体内外药效有待证实。未来研究可着重探索PSMD4通过Akt/COX2通路调控HCC进展的具体机制,以及FABP1如何通过PPARG/CD36轴影响脂肪酸氧化。这些发现不仅为HCC早期诊断提供新型生物标志物,也为开发靶向线粒体的联合治疗方案奠定了理论基础。
生物通微信公众号
知名企业招聘