
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习联合多组学鉴定免疫相关LncRNA特征作为预测乳腺癌预后的生物标志物
【字体: 大 中 小 】 时间:2025年07月05日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对乳腺癌预后预测的临床挑战,通过整合多组学数据和机器学习算法,构建了基于9个免疫相关长链非编码RNA(lncRNA)的预后特征模型(IRLS)。研究人员利用TCGA和GEO数据库的转录组数据,结合WGCNA和ImmuLncRNA算法筛选出72个免疫相关lncRNA,并通过101种机器学习组合优化出具有高预测效能的IRLS评分系统。验证显示该模型能显著区分患者生存风险(P<0.05),预测性能优于95个已发表模型,并可指导化疗(如紫杉醇)和免疫检查点抑制剂(如atezolizumab)的个性化治疗选择。该研究为乳腺癌精准医疗提供了新型分子标志物。
乳腺癌已超越肺癌成为全球发病率最高的恶性肿瘤,其分子异质性和治疗后复发转移仍是临床重大挑战。现有21基因检测等工具主要适用于激素受体阳性患者,而免疫相关lncRNA在乳腺癌预后预测中的作用尚未充分探索。南京明基医院联合国内外多家机构的研究团队在《Scientific Reports》发表研究,通过整合机器学习与多组学数据,开发了基于免疫相关lncRNA的预后特征模型(IRLS),为乳腺癌精准治疗提供新策略。
研究采用TCGA和GEO数据库中2,607例患者数据,通过ssGSEA算法量化免疫浸润并分型,结合WGCNA和ImmuLncRNA算法筛选出72个关键lncRNA。利用10种机器学习算法构建101种组合,最终确定由Lasso回归和StepCox反向筛选的9-lncRNA特征(含PRKAR1B-AS1等核心分子)。技术路线涵盖转录组重注释、免疫细胞浸润评估(TIMER/xCell等6种算法)、共识聚类和机器学习模型优化。
免疫浸润亚型鉴定
通过ssGSEA将患者分为免疫富集型(C1)和免疫贫乏型(C2),C1组显示更高的CD8+T细胞浸润和ESTIMATE免疫评分(P<0.0001)。
关键lncRNA筛选
WGCNA绿色模块(|MM|>0.8)与免疫特征高度相关,而ImmuLncRNA分析揭示1278个lncRNA主要调控"细胞因子受体"和"抗原提呈"通路,两者交集确定72个候选分子。
模型构建与验证
IRLS风险评分=0.215×C22orf34表达量+(-0.153)×DBH-AS1表达量+...。在17个独立队列中,高风险组总生存期(OS)显著缩短(HR=2.31,P<0.001),5年OS预测AUC达0.744-0.792。与AJCC分期联合使用时,C-index提升至0.792(P<0.05)。
治疗预测价值
紫杉醇应答者的IRLS评分更高(AUC=0.814-0.850),而免疫治疗队列中低IRLS组对atezolizumab响应率提升(AUC=0.625)。机制上,低风险组呈现更高的CD8A、PD-L1表达及TMB(r=-0.42,P<0.01)。
该研究创新性地建立了首个整合免疫相关lncRNA与机器学习的乳腺癌预后系统。IRLS模型不仅超越传统临床指标和现有分子标志物的预测效能,还能指导化疗药物选择和免疫治疗获益人群筛选。特别是发现PRKAR1B-AS1等lncRNA与免疫激活显著相关,为三阴性乳腺癌的免疫治疗提供了新靶点。研究局限性在于尚未开展lncRNA功能实验,未来需通过类器官模型等进一步验证其调控机制。这项成果标志着乳腺癌预后评估进入多组学智能预测时代,为临床决策提供了可靠的计算生物学工具。
生物通微信公众号
知名企业招聘