机器学习揭示线粒体特征基因对早期乳腺癌预后的精准预测价值

【字体: 时间:2025年05月06日 来源:Clinical Breast Cancer 2.9

编辑推荐:

  本研究针对早期乳腺癌预后预测缺乏精准分子标志物的临床难题,通过机器学习算法系统分析1136个线粒体相关基因,构建出包含ABAT、MRPS9等14个关键基因的线粒体特征模型(HR=2.08, 95%CI:1.20-3.62)。该模型在SCANB训练集(AUC 0.84/0.79/0.78)和TCGA验证集(AUC 0.92/0.83/0.78)中均展现卓越预测性能,结合临床变量构建的列线图可为1/3/5年生存率提供个体化评估,为乳腺癌精准诊疗提供新策略。

  

乳腺癌作为全球女性发病率最高的恶性肿瘤,其异质性给临床预后评估带来巨大挑战。尽管现有诊疗手段不断进步,早期乳腺癌患者的生存预测仍依赖传统临床病理特征,缺乏精准的分子标志物。线粒体作为细胞能量工厂,其功能异常通过影响细胞增殖、凋亡等过程参与肿瘤发生发展,但线粒体相关基因在乳腺癌预后中的系统研究仍属空白。

瑞典隆德大学的研究团队通过整合SCANB(n=6657)和TCGA-BRCA(n=1039)两大队列数据,首次采用机器学习方法系统筛选线粒体相关基因标志物。研究从MitoCarta3.0数据库获取1136个基因,通过单变量Cox回归、bootstrap重采样和LASSO Cox回归三重筛选,最终锁定ABAT、CLPB、MRPS9等14个关键基因构建风险评分模型。该模型在训练集和验证集中均显示显著预测价值,高风险组患者死亡风险增加2.41倍(95%CI:2.08-2.80)。

关键技术方法包括:1)从SCANB和TCGA获取转录组(FPKM/TPM)及临床数据;2)采用单变量Cox回归(P<0.01)初筛234个基因,经1000次bootstrap验证保留231个;3)LASSO回归构建14基因特征模型;4)通过时间依赖性ROC曲线(1/3/5年AUC)和Kaplan-Meier分析评估性能;5)结合年龄、PAM50分型等临床变量构建列线图。

特征选择揭示14基因线粒体特征
通过三重机器学习筛选出的基因在测试集中保持稳定表达趋势,其中ABAT(γ-氨基丁酸代谢关键酶)等保护性基因与良好预后相关,而MRPS9(线粒体核糖体蛋白)等风险基因高表达预示不良结局。

内外验证证实模型稳健性
风险评分公式包含UQCRFS1(复合体III亚基)等基因的加权表达量。模型在SCANB测试集(HR=1.77)和TCGA验证集(HR=1.49)均保持预测效力,1年AUC最高达0.92。

列线图实现临床转化应用
整合T/N分期、PAM50亚型等变量的列线图显著提升预测精度,校准曲线显示预测/实际生存率高度吻合。决策曲线分析证实其临床适用性优于单一指标,尤其在HR+/HER2+亚型中表现突出。

横向比较凸显模型优势
与已发表的DNA修复相关(8基因)、铁死亡相关(9基因)等16种预后模型相比,该线粒体特征在相同测试集中1年AUC提高0.2-0.5,克服了小样本研究的过拟合问题。

这项研究首次系统证实线粒体基因组可作为早期乳腺癌的独立预后因素。14基因特征中,MTCH1(线粒体载体同源物)等新靶点的发现为机制研究提供方向,而PLGRKT(纤溶酶原受体)等基因与治疗抵抗的关联值得深入探索。尽管存在瑞典人群偏倚等局限,该模型通过万例级队列验证和临床变量整合,为实现个体化辅助治疗决策提供了可靠工具。未来需在多中心前瞻性研究中验证,并探索这些线粒体基因在肿瘤代谢重编程中的具体作用机制。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号