基于机器学习的乳腺X线摄影和超声影像组学预测乳腺癌PIK3CA突变

《European Journal of Medical Research》:Predicting PIK3CA mutation in breast cancer with machine learning based multimodal image radiomics

【字体: 时间:2025年11月25日 来源:European Journal of Medical Research 3.4

编辑推荐:

  本研究针对乳腺癌PIK3CA基因突变预测的临床需求,利用机器学习算法构建了基于乳腺X线摄影(MMG)和超声(US)的影像组学模型。研究发现,结合临床病理因素的多模态影像组学模型(C+MMG+US+LR)预测性能最佳(AUC=0.899),为乳腺癌靶向治疗策略制定提供了无创、便捷的新方法。

  
乳腺癌是全球女性最常见的恶性肿瘤,每年新发病例约230万,位居癌症死亡原因第五位。在乳腺癌的分子分型中,磷脂酰肌醇3-激酶(PI3K)信号通路扮演着关键角色,而PIK3CA基因突变在乳腺癌患者中发生率较高,与治疗耐药性和不同预后效果相关。随着基因组测序技术的快速发展,针对PIK3CA突变的抑制剂药物(如alpelisib和inavolisib)的应用,显著延长了患者生存期,特别是对于那些具有更强侵袭性和低分化肿瘤的患者。
然而,基因检测存在费用昂贵、有创、耗时长等局限性,并非所有患者都能获得。因此,开发无创、便捷且准确的早期预测PIK3CA突变的方法,对于指导乳腺癌患者个体化治疗策略具有重要意义。
传统方法主要依赖临床病理指标或常规影像特征预测PIK3CA突变,但预测性能相对较低。近年来,影像组学作为一种新兴方法被提出用于预测基因突变,但既往研究主要集中在MRI上。相比之下,乳腺X线摄影(MMG)和超声(US)作为更广泛应用的诊断工具,在乳腺检查中具有便捷、低成本、省时等优势。然而,利用MMG和US影像组学预测PIK3CA突变的研究相对较少。
在此背景下,Yao等人发表在《European Journal of Medical Research》上的研究,旨在探索基于机器学习(ML)的方法,利用MMG和US影像组学特征早期预测乳腺癌中的PIK3CA突变状态。
本研究主要应用了以下关键技术方法:回顾性收集了2020年1月至2023年12月期间186例原发性乳腺癌患者的临床资料、PIK3CA基因检测结果以及治疗前的MMG和US图像。患者被随机分为训练集(130例)和测试集(56例)。由经验丰富的放射科医生手动勾画肿瘤感兴趣区域(ROI),并使用3D Slicer和PyRadiomics软件提取影像组学特征。采用合成少数类过采样技术(SMOTE)、Z-score标准化、均值归一化、主成分分析(PCA)、皮尔逊相关系数(PCC)和递归特征消除(RFE)等方法进行特征处理和选择。最后,应用逻辑回归(LR)、自适应增强(AdaBoost)和朴素贝叶斯(NB)三种机器学习算法构建并验证了基于单一影像模态(MMG或US)、结合临床病理因素(C+MMG或C+US)以及融合多模态影像和临床病理因素(C+MMG+US)的预测模型。模型性能通过受试者工作特征曲线下面积(AUC)等指标进行评估。
临床病理特征分析
在186例乳腺癌患者中,59例(31.7%)存在PIK3CA突变。单因素分析显示,雌激素受体(ER)阳性和孕激素受体(PR)阳性与PIK3CA突变显著相关(p<0.05),而年龄、临床T分期、肿瘤最大径、组织学类型、肿瘤分级、淋巴结状态、HER2状态及Ki67水平等因素与突变无显著相关性。
基于单一影像模态的影像组学模型
在测试集中,基于US的影像组学模型预测性能普遍优于基于MMG的模型。其中,US+LR模型的AUC值最高,为0.788,而MMG+LR模型的AUC值为0.718,两者差异具有统计学意义(p<0.05)。分析发现,在LR分类器中,US模型最具相关性的特征是与小波变换后的灰度级依赖矩阵(GLDM)相关的特征,而MMG模型则是与小波变换后的灰度级区域大小矩阵(GLSZM)相关的特征,提示US图像在反映肿瘤异质性方面可能提供更多有价值的信息。
结合临床病理因素的影像组学模型
将ER、PR状态与影像组学特征结合后,模型的预测性能得到提升。在测试集中,C+US+LR模型的AUC值达到0.827,显著高于C+MMG+LR模型的0.740(p<0.001)。这表明联合临床病理因素可以进一步增强模型的预测能力,且US影像组学在此方面依然保持优势。
融合多模态影像和临床病理因素的混合模型
性能最佳的模型为融合了临床病理因素、MMG和US影像组学特征的C+MMG+US+LR混合模型。该模型在训练集中的AUC高达0.931,在测试集中也达到了0.899,显著优于同框架下的AdaBoost和NB模型(p<0.05)。该模型在测试集中表现出89.7%的敏感性和89.8%的特异性,显示出优异的预测效能。
机器学习分类器比较
在三种机器学习算法中,逻辑回归(LR) classifier consistently demonstrated superior predictive ability for PIK3CA mutation compared to AdaBoost and Naive Bayes classifiers across different model configurations (radiomics-only, clinical-radiomics, and hybrid models)。
本研究通过构建和验证多种机器学习模型,证实了基于多模态影像组学(特别是结合超声影像组学)的方法在无创预测乳腺癌PIK3CA突变方面具有重要价值。研究结论指出,超声影像组学显示出比乳腺X线摄影影像组学更好的预测能力。尤其重要的是,融合了临床病理因素和多模态影像(US+MMG)的逻辑回归(LR)模型性能最佳(测试集AUC=0.899),其改进的性能有助于制定个体化的治疗策略。
该研究的重要意义在于,为缺乏昂贵、大型医疗设备(如MRI)的基层医疗机构提供了一种便捷、低成本的PIK3CA突变预测工具。相较于传统的基因检测方法,这种基于MMG和US的影像组学分析方法具有更广阔的临床应用前景,有望在乳腺癌精准医疗领域发挥重要作用,辅助临床医生为患者制定更合理的靶向治疗方案。然而,研究也存在一些局限性,如单中心回顾性设计、未纳入非肿块型病变、未对所有分子亚型进行分层分析以及未区分基因突变热点(如外显子9或20)等,未来需要多中心、大样本的前瞻性研究进一步验证和完善。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号