基于可解释机器学习模型预测宫颈癌术前淋巴结状态:单核细胞生物学合理性的多组学验证与临床决策支持

【字体: 时间:2025年10月10日 来源:Frontiers in Immunology 5.9

编辑推荐:

  本研究开发并验证了用于预测宫颈癌(CC)淋巴结转移(LNM)的可解释机器学习模型,证实单核细胞计数(MO#)是关键风险因子(OR=2.28),通过单细胞RNA测序(scRNA-seq)和批量RNA测序(bulk-RNA-seq)揭示了单核细胞在IIIC1期富集及其与预后的显著关联,神经网络模型(NNET)表现出最优预测性能(AUC:0.86/0.79/0.76),SHAP方法增强了模型临床适用性。

  
1 引言
宫颈癌(Cervical Cancer, CC)在全球女性恶性肿瘤中发病率位居第四,在中国女性生殖系统恶性肿瘤中位列第六。研究表明伴有淋巴结转移(Lymph Node Metastasis, LNM)的患者5年生存率显著降低(50-55% vs 85-90%),且根据国际妇产科联盟(Federation of Gynecology and Obstetrics, FIGO)2018分期标准,LNM患者直接归为IIIC期需接受同步放化疗。传统影像学检查如磁共振成像(Magnetic Resonance Imaging, MRI)和计算机断层扫描(Computed Tomography, CT)对LNM的敏感度有限(38-56%),而放射组学模型存在重复性差的问题。近年来研究发现外周血参数(如单核细胞计数MO#)与系统性炎症反应及肿瘤预后相关,为本研究提供新的思路。
2 方法
2.1 临床数据库
回顾性纳入2020年1月至2024年12月292例CC患者(训练集204例,回顾性测试集88例),前瞻性收集2025年1月至6月54例患者作为前瞻性测试集。所有患者均接受根治性子宫切除术+盆腔淋巴结清扫术,排除术前影像学确诊LNM、合并其他恶性肿瘤、数据不全及神经内分泌癌等罕见病理类型患者。
2.2 测序数据处理
从GEO数据库获取scRNA-seq数据(GSE171894),包含FIGO IB/IIB/IIIC1期样本。使用Seurat R包(v4.4.0)进行质控、标准化和聚类分析。从TCGA数据库获取批量RNA-seq数据,最终纳入235例样本进行生存分析和免疫细胞浸润计算。
2.3 机器学习模型构建
采用逻辑回归(Logistic Regression, LR)、随机森林(Random Forest, RF)、朴素贝叶斯(Naive Bayes, NB)、决策树(Decision Tree, DT)和神经网络(Neural Network, NNET)五种模型,按7:3划分训练集与回顾性测试集,采用十折交叉验证。使用SHAP(Shapley Additive Explanation)方法增强模型可解释性,并通过ShinyApps平台部署在线预测工具。
3 结果
3.1 风险因子识别
多因素分析显示FIGO(2018)分期、鳞状细胞癌抗原(Squamous Cell Carcinoma Antigen, SCCA)、单核细胞计数(MO#)和血小板计数(Platelet Count, PLT#)是LNM的独立风险因子(p<0.05),其中MO#的比值比(Odds Ratio, OR)最高(OR=2.28)。加入MO#的预测模型AUC从0.68显著提升至0.74。
3.2 单细胞转录组验证
scRNA-seq分析发现IIIC1期样本中单核细胞比例较IB/IIB期显著增加,标记基因FCN1CD14表达上调。批量RNA-seq中单核细胞相关基因(IGSF6OLR1CD1C)在LNM组中表达升高。
3.3 预后关联分析
TCGA数据库分析显示单核细胞与静息肥大细胞是总体生存期(Overall Survival, OS)的独立风险因子(风险比Hazard Ratio, HR>1)。基于此构建的预后模型在训练集1/2/3年AUC分别为0.77/0.85/0.75,高风险组OS显著缩短。
3.4 模型性能比较
NNET模型在训练集、回顾性测试集和前瞻性测试集的AUC分别为0.86、0.79和0.76,显著优于其他模型(De Long检验p<0.05)。校准曲线和Brier评分证实NNET具有最佳预测一致性,NRI(Net Reclassification Index)和IDI(Integrated Discrimination Improvement)分析显示其重分类能力显著提升。
3.5 模型可解释性
SHAP分析显示FIGO分期对预测贡献度最高,其次为PLT#、淋巴细胞单核细胞比值(Lymphocyte Monocyte Ratio, LMR)、SCCA和MO%。高级别FIGO分期、高SCCA水平和高MO#水平显著增加LNM风险。在线预测平台(https://cclnmpredictor.shinyapps.io/shinyapp/)可实现实时风险评估。
4 讨论
本研究首次通过多组学数据验证外周血单核细胞与CC淋巴转移的生物学关联。单核细胞通过Tie2/Ang2信号通路被招募至肿瘤微环境,分化为肿瘤相关巨噬细胞(Tumor-Associated Macrophages, TAMs)促进血管生成和免疫抑制。与传统影像学和放射组学模型相比,本研究构建的机器学习模型具有更高预测效能(AUC 0.79 vs 0.65-0.745)和临床适用性。
5 结论
单核细胞计数是宫颈癌淋巴结转移的关键风险因子,基于临床特征和血液参数构建的NNET模型具有优异预测性能,SHAP方法有效提升模型可解释性,为个体化治疗决策提供支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号