
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:人工智能整合多组学数据实现乳腺癌精准分层及耐药性预测
【字体: 大 中 小 】 时间:2025年09月13日 来源:Frontiers in Oncology 3.3
编辑推荐:
本综述系统阐述了人工智能(AI)技术在乳腺癌(BC)精准诊疗中的前沿应用,涵盖多组学数据整合、分子分型识别、免疫微环境(TIME)量化及耐药机制预测等关键方向,为个体化诊疗策略提供了创新性理论依据与技术支撑。
人工智能驱动的影像组学将常规乳腺影像转化为可重复的定量生物标志物,支持早期检测、生物信息驱动的风险分层和高效筛查流程。数据质量与标准化是基础,需遵循定量影像生物标志物联盟(QIBA)和定量影像网络(QIN)的协议协调标准。分割策略通过手动或自动深度学习(如U-Net变体)精准勾画病灶及瘤周组织,捕获微环境异质性。特征工程从形状、纹理到深度表征(如CNN、Vision Transformers)多维度提取信息,结合临床变量提升模型鲁棒性。特征选择需通过严格降维方法(如相关性修剪、树基重要性排序),模型构建涵盖逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)及深度生存模型。验证与校准需通过多中心外部测试、校准曲线及决策曲线分析(DCA)证明临床效用。 translational considerations include addressing generalizability, fairness through federated learning (FL), and privacy-preserving techniques to ensure equitable performance across demographics and scanners.
AI通过整合多模态影像数据显著提升乳腺癌良恶性鉴别准确率。例如,U-Net结合案例推理(CBR)模型在乳腺X线摄影(MG)图像中实现91.34%的恶性肿块鉴别准确率和86.71%的分割精度。浅-深卷积神经网络(CNN)模型在低能图像处理中达到92%的分类准确率,而混合CNN架构在mini-MIAS数据集上甚至实现99%的诊断准确率。瘤周区域特征(如梯度、灰度共生矩阵GLCM)结合对侧乳腺正常组织特征可将分类AUC从0.79提升至0.84。对比增强 mammography (CEM) 模型通过自动分割和三 compartment 量化,将阳性预测值提高47%,减少35.8%的非必要活检。多参数MRI模型整合T2WI、ADC和动态对比增强(DCE)序列,预测HER2表达状态的AUC达0.95,结合BI-RADS评分后诊断AUC升至0.98。分子分型预测中,DCE-MRI深度学习模型对ER+/–、PR+/–、HER2+/–和三阴性亚型的AUC分别为0.89、0.69、0.65和0.67。CEM特征在头足位(CC)视图中区分Luminal与非Luminal亚型的准确率达94%。PET/CT影像组学结合临床指标(如Ki-67)预测HER2状态的AUC为0.95。瘤周 microenvironment 分析进一步增强三阴性乳腺癌(TNBC)判别能力,外部验证AUC达0.72。多实例学习框架BBMIL直接从H&E全 slide 图像(WSI)预测ER/PR/HER2、PAM50及免疫相关基因签名,在TCGA-BRCA中AUC为0.883/0.788/0.703/0.803。
腋窝淋巴结(ALN)转移是判断预后和制定治疗方案的核心指标。超声结合深度学习量化淋巴结形态、边缘和血流特征,Google Cloud Auto ML Vision模型在外部验证中灵敏度74.0%、特异度64.4%。12层CNN模型在169例患者中灵敏度65.5%、特异度78.9%、AUC 0.72。Kohonen自组织模型在908张图像中灵敏度98%、特异度99%、AUC 0.97。多模态数据整合突破单模态局限,超声结合剪切波弹性成像(SWE)的模型区分淋巴结转移状态的AUC达0.902,预测转移负荷的AUC为0.905。DL影像组学模型在937例患者中预测前哨淋巴结(SLN)转移灵敏度89.7%、AUC 0.81,非前哨淋巴结(non-SLN)灵敏度98.4%。Inception V3架构在1,055张超声图像中灵敏度85%、特异度73%、AUC 0.89,超越5名放射科医生平均水平(灵敏度73%、特异度63%)。CT和MRI扩展AI应用场景,可变形注意力VGG19算法在对比增强CT(CECT)中灵敏度95%、特异度86.75%、AUC 0.9694。MRI的CNN模型在多中心数据中灵敏度92.1%、AUC 0.91。DCE-MRI影像组学结合临床特征构建的列线图预测腋窝转移AUC达0.90。
AI影像组学在TNBC预后预测中展现卓越价值。基于免疫浸润细胞(IIC)特征的MLIIC签名通过25种机器学习算法构建,显著关联TNBC患者生存结局。深度学习算法量化肿瘤 microenvironment 空间特征(如Digi-sTILs和Digi-TAS评分),在TCGA队列中C-index分别为0.65和0.60。TLS/TB指数通过AI图像分析构建,与TNBC患者总生存(OS)和无复发生存(RFS)显著正相关,且预测性能超越传统TNM分期。影像组学基于DWI序列特征高度关联前哨淋巴结转移,DCE-MRI和数字乳腺断层合成(DBT)特征预测Ki67表达的AUC分别为0.773和0.698。MRI影像组学评分显著关联无病生存(DFS),并预测多基因检测复发评分。TNBC中瘤周异质性特征作为无复发生存和总生存的预后因子。新辅助治疗(NAT)反应预测中,治疗前多参数MRI(mpMRI)影像组学模型预测病理完全缓解(pCR)的AUC达0.79,结合分子亚型分析进一步提升准确性。PET/CT和超声影像组学结合深度学习特征预测pCR和残留癌负担(RCB)的AUC分别达0.73和0.94。全自动多模态流程MIFAPS整合MRI、病理WSI和临床变量,在多中心前瞻性队列(n=1004)中预测NAC后pCR的AUC为0.882–0.909。纵向多模态模型结合MRI“habitat”影像组学、转录组和单细胞RNA测序(scRNA-seq),在外部验证、免疫治疗和多组学队列中AUC分别为0.863、0.813和0.888,高分病例显示B细胞浸润显著增加(p=0.00039)。
AI通过多组学分析揭示肿瘤耐药机制。基于16种机器学习算法测试8类分子谱,CART算法构建的四变量非线性分类器通过整合hsa-miR-21-5p、hsa-miR-155-5p、hsa-miR-34a-3p和hsa-miR-200c-3p表达预测阿霉素耐药,中位马修斯相关系数(MCC)=0.56、AUC 0.80。深度学习聚类9068个小分子抑制剂库,N-取代喹唑啉-4-胺类似物占比27.6%,CADD策略设计的新型4-苯胺基喹唑啉衍生物通过DL模型预测准确率89.2%,化合物9对MCF-7细胞的IC50为2.50 ± 0.21 μM,EGFR激酶抑制IC50为2.53 ± 0.15 nM,凋亡诱导率升至64.3%。基于程序性细胞死亡(PCD)模式的术后预后模型构建12基因细胞死亡指数(CDI),在TCGA(n=1,132)和METABRIC(n=1,904)队列中C-index达0.73–0.81,高CDI组Treg细胞比例增加2.8倍,免疫检查点(如PD-L1、CTLA4)表达上调。药物敏感性预测显示高CDI患者对多西他赛(OR=0.32, p=0.008)和奥沙利铂(OR=0.29, p=0.003)耐药,对pabocinib敏感(IC50降低64.7%, p=0.001)。注释自由的H&E框架预测上皮-间质转化(EMT)表型和内分泌反应总体准确率81.25%,88.7%内分泌耐药切片分类为间质型。治疗前基因组、转录组和免疫生态系统特征通过机器学习显示残留疾病与基线肿瘤生态的单调关系。可解释多特征模型预测紫杉醇反应,PET/MRI和MRI影像组学/DL显著改善新辅助化疗pCR预测。 pharmacogenomic approaches highlight CYP2D6代谢状态对他莫昔芬获益的作用,耐药基因风险签名分层HER2阳性乳腺癌结局。现代方法耦合药物分子图与肿瘤基因表达谱,通过图神经网络(如DIPK)提升IC50预测性能。生成式AI和LLM指导框架变革抗体设计, enable rapid sequence exploration and affinity maturation.
AI在乳腺癌研究中的应用面临模型验证局限性、可解释性不足及多模态数据整合挑战。当前模型多依赖单中心回顾性数据,泛化能力受限,且缺乏前瞻性临床试验验证。深度学习模型的“黑箱”特性降低临床信任度,传统影像组学特征与肿瘤生物事件的关联机制不明确。多模态数据(如基因组学、影像组学、病理组学)整合需克服异质性数据融合技术难题,且需开发用户友好的集成化AI辅助系统以实现临床无缝对接。
未来研究需优化模型验证策略,强调多中心外部验证和前瞻性临床试验推进。提升模型可解释性 through technical means such as parsing DL decision processes or combining DL features with traditional ML modeling. 深化影像组学与生物事件关联研究,整合多组学数据揭示成像特征与肿瘤生物学行为的内在联系。构建多功能集成AI系统,参考CAD系统在乳腺癌筛查中的成功经验,通过直观界面和可解释报告降低使用门槛,最终实现AI技术在乳腺癌诊疗全流程中的全面整合与患者生存获益提升。
乳腺癌的临床挑战集中于晚期诊断比例高及分子与免疫异质性导致的治疗反应变异性。AI辅助阅读在人群筛查中维持或提高癌症检出率的同时减少约50%放射科医生工作量,提供可扩展的早期检测与干预路径。多模态与纵向整合(如乳腺X线摄影、超声、MRI结合数字病理、转录组学和单细胞组学)可无创量化肿瘤免疫微环境,改善pCR、免疫治疗反应和耐药风险分层,为个体化治疗提供 actionable 概率证据。临床可转化性与治理需大规模、多中心、时间外部前瞻性验证,常规报告与临床行动直接相关的终点(如校准、决策曲线净收益、分期转移、PPV、召回率和工作量)。随着方法与治理要素成熟,AI可