基于血清microRNA的机器学习模型PCa4miR:8,741例混合队列中前列腺癌早期筛查的新突破

【字体: 时间:2025年07月16日 来源:Discover Oncology 2.8

编辑推荐:

  本研究针对前列腺癌(PCa)早期筛查中前列腺特异性抗原(PSA)检测特异性不足的临床难题,通过分析8,741例包含PCa、其他癌症(OCa)、良性前列腺疾病(BPD)和健康人群(HP)的混合队列血清microRNA数据,开发了基于AdaBoost算法的四联miRNA模型PCa4miR(miR-1290/miR-6777-5p/miR-1343-3p/miR-6836-3p),其灵敏度达88.5%、特异性95.9%,AUC值在验证集中达0.981。该研究首次构建了适用于复杂临床场景的PCa筛查体系,为降低不必要穿刺活检提供了新策略。

  

前列腺癌(PCa)作为男性泌尿系统最高发的恶性肿瘤,全球发病率高居第二位。尽管早期患者的5年生存率可达100%,但临床面临严峻挑战:发展中国家超60%患者初诊时已发生转移,生存率骤降至30%。目前依赖前列腺特异性抗原(PSA)的筛查方法存在明显缺陷——作为器官特异性而非肿瘤特异性标志物,PSA在良性前列腺疾病(BPD)中也会升高,导致美国每年约7.5万例不必要穿刺活检。更棘手的是,现有基于microRNA(miRNA)的筛查模型多局限于PCa/BPD/HP三组对照,未能涵盖临床实际中并存的其他癌症(OCa)患者,极大限制了应用价值。

中山大学附属第三医院的研究团队在《Discover Oncology》发表了一项突破性研究。通过整合最大规模的8,741例混合队列(含PCa/10种OCa/BPD/HP),采用六种机器学习算法开发出四联miRNA模型PCa4miR。该模型在测试集(AUC=0.972)、验证集(AUC=0.981)和外部验证集(AUC=0.811)中均表现优异,尤其对I-II期PCa的筛查准确率超85%。更创新的是,团队首次建立基于miRNA比值(miR-1290/miR-6836-3p等)的PCaSS评分系统,通过XGBoost算法实现96.3%的灵敏度和89.8%特异性。

关键技术方法包括:1) 从GEO数据库获取8,741例血清miRNA测序数据,按4:1比例分为建模集和验证集;2) 采用MRMR(最大相关最小冗余算法)、IV(信息价值算法)和LASSO(最小绝对收缩选择算子)筛选特征miRNA;3) 通过BorderlineSMOTE算法解决数据不平衡问题;4) 使用KNN、SVC、XGBoost等六种机器学习算法构建模型;5) 采用DCA(决策曲线分析)和PCA(主成分分析)评估模型性能。

模型构建与验证

通过18个候选miRNA的3060种四联组合筛选,最终确定miR-1290/miR-6777-5p/miR-1343-3p/miR-6836-3p为最优组合。PCa4miR模型在训练集达到近乎完美的AUC=0.999,且热图分析显示这四种miRNA在PCa患者中呈现稳定表达模式:前三种显著上调,miR-6836-3p显著下调。

临床鉴别能力

模型在区分PCa与10种OCa(胆道癌、膀胱癌等)时表现突出,对BPD的鉴别准确率达97.2%。亚组分析显示,无论年龄≤65岁或>65岁、临床分期I-II或III-IV期,模型准确率均保持80%以上,证明其临床普适性。

创新评分系统

基于miRNA比值构建的PCaSS模型突破技术变异限制,其中miR-1290/miR-6836-3p比值最具鉴别力。XGBoost算法驱动的PCaSS模型在外部验证中AUC达0.898,显著优于传统单miRNA指标。

这项研究通过三大创新点改写了PCa筛查范式:首次在万人级混合队列中验证模型、首创适用于多癌种共存的筛查体系、开发首个基于miRNA比值的评分系统。尽管存在外部验证样本量有限等局限,但团队已启动多中心前瞻性研究,未来或可替代25%不必要的穿刺活检。值得注意的是,miR-1290已被证实通过癌症相关成纤维细胞外泌体促进PCa转移,而miR-6836-3p等新靶点的功能机制仍有待探索,这为后续研究指明了方向。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号