综述:基于放射学的人工智能预测泛癌靶向治疗反应:全面综述
《Journal of Translational Medicine》:Radiology-based artificial intelligence for predicting targeted therapy response in pan-cancer: a comprehensive review
【字体:
大
中
小
】
时间:2025年11月25日
来源:Journal of Translational Medicine 7.5
编辑推荐:
本综述系统回顾了112项研究,探讨了基于放射学的人工智能(AI)模型在预测泛癌靶向治疗反应中的应用。文章将AI方法分为直接预测(关联影像特征与临床结局)和间接预测(通过影像推断分子生物标志物状态)两大范式,涵盖了机器学习(ML)与深度学习(DL)技术。综述指出,计算机断层扫描(CT)是最常用影像模态,肺癌和乳腺癌是研究最集中的癌种。尽管现有研究显示出 promising 的预测性能,但仍面临数据异质性、模型可解释性及临床转化等挑战。作者还开发了交互式网站以持续更新相关资源。
精准肿瘤学日益强调靶向治疗在多种恶性肿瘤管理中的作用。然而,仅基于组织分子检测进行患者分层存在局限性,包括侵入性活检、肿瘤异质性以及分子改变并不总是转化为治疗敏感性。在此背景下,医学影像成为一种有前景的治疗预测模态,其能够无创、可重复地表征肿瘤宏观形态、空间异质性及可能反映肿瘤生物学和微环境状态的表型特征。随着人工智能(AI)的发展,影像分析已从定性视觉评估发展为定量、自动化预测建模,为将影像衍生信息纳入靶向治疗反应预测框架创造了机会。
AI的快速发展改变了医学实践。在肿瘤学,特别是在预测靶向治疗反应方面,AI为挖掘潜在影像模式和支持临床决策提供了关键工具。主要存在两种方法路径:机器学习(ML)和深度学习(DL)。ML方法通常嵌入放射组学框架中,对CT、磁共振成像(MRI)或正电子发射断层扫描(PET)图像进行预处理,提取手工特征以表征肿瘤形态、纹理、强度分布和空间异质性。除了常规放射组学,栖息地成像被引入以将肿瘤划分为具有不同放射学表型的亚区,从而增强对瘤内异质性的捕捉。这些特征经过可重复性和稳定性评估,随后进行特征选择或降维,并使用回归方法、基于核的分类器或集成技术等算法进行建模。相比之下,DL方法采用多层神经网络直接从原始影像数据中自动学习层次化表征,无需手工特征。卷积神经网络(CNN)已广泛用于分析肿瘤形态和治疗相关变化;循环神经网络(RNN)用于处理序列或纵向影像数据;而更新近的创新如Transformer和图神经网络(GNN)则能够建模长程依赖、空间关系和关系结构。越来越多地,多模态DL框架整合了影像与临床、分子或基因组数据,构建更全面的预测模型。
尽管方法多样,医学影像中的AI应用通常遵循结构化工作流程。第一阶段是数据整理与标准化,包括体素重采样、强度归一化、伪影控制以及通过手动、半自动或自动分割勾画感兴趣区域(ROI)。第二阶段是表征构建:ML侧重于通过稳健性和稳定性分析提炼放射组学和栖息地描述符;而DL则采用神经编码器,通常通过迁移学习或自监督预训练初始化,以学习高级特征。第三阶段是任务特异性建模与优化,其中表征通过预测头映射到临床终点,如分类、回归或生存结果;超参数调优、损失函数选择、正则化、类别不平衡校正和数据增强是基本组成部分;在DL中,编码器和预测头通常是端到端优化的。第四阶段涉及验证与评估,结合内部交叉验证、独立保留队列和外部队列多中心测试,指标包括曲线下面积(AUC)、精确召回曲线下面积(AUPRC)、准确度、敏感性、特异性、C-index和时间依赖性AUC,并辅以校准和决策曲线分析。最后阶段是解释与临床就绪性:ML模型通常通过特征权重或SHAP分析提供可解释性,而DL模型则依赖可视化方法,如显著性图、类激活图(CAM)和注意力热图,并日益通过可解释AI(XAI)增强。确保可重复性、对域偏移的鲁棒性、严格校准和符合报告标准对于靶向治疗反应预测的临床转化仍然至关重要。
基于前述AI在放射学中的方法学概述,我们提出一个概念框架,将用于预测靶向治疗反应的基于放射学的AI方法分为两种范式:(i)直接预测,从影像直接学习临床终点(如治疗反应、无进展生存期(PFS)、总生存期(OS));(ii)间接预测,从影像推断分子生物标志物,进而提示治疗获益。直接预测具有临床直观性,与治疗结局紧密对齐,并具有直接的转化潜力,但常受限于小型回顾性队列、治疗选择混杂和异质性结局定义。间接预测通过将影像表型与分子生物标志物联系起来,并利用更大的生物标志物标记数据集,提供了生物学可解释性和可扩展性,但它依赖于替代标志物的有效性,对检测变异性敏感,并且需要额外的证据链来连接临床获益。
该分类法提供了几个优势:(1)它将临床终点与分子替代标志物分开,避免了混淆异质性研究设计,并允许进行有意义的跨癌症比较;(2)它阐明了证据和监管路径,因为直接预测可以直接针对临床终点进行验证,从而符合基于临床的标准,而间接预测需要一个两步证据链,包括影像到生物标志物的准确性以及已建立的生物标志物到结局的有效性。
为了将此分类法置于连贯结构中,图2呈现了一个概念图,将基于放射学的AI模型沿两个组织原则定位:预测目标是临床终点还是通过生物标志物状态介导的,以及特征是手工放射组学还是深度网络学习的。通过将这些维度与代表性癌症类型和治疗靶点并列,该框架突出了该领域应用的广度和方法学的多样性。
基于此框架,表1和表2提供了代表性研究的系统概述,分别按直接和间接预测组织。这些表格总结了输入参数、建模策略和报告结果,允许跨不同疾病背景进行比较。为了补充这些静态摘要,我们还开发了一个配套网站,作为一个活的、持续更新的资源,如图3所示。它提供对已综述研究的交互式访问,使用户能够按作者、治疗靶点或癌症类型浏览,并直接比较跨多个靶点和恶性肿瘤的模型性能。该平台还集成了评估指标(如AUC、准确度、ROC曲线)的交互式可视化,允许更直观地评估模型质量。通过将分散的证据整合到一个可访问的数字平台,该网站增强了透明度、可重复性和知识传播,为学术研究和临床转化之间提供了重要桥梁。
在确定的36项研究中,大多数使用计算机断层扫描(CT,80%,n=29),其次是磁共振成像(MRI,16.7%,n=6)和超声(US,2.8%,n=1)。研究的主要癌症类型是肺癌(36%,n=13)、肝癌(19.4%,n=7)、结直肠癌(13.9%,n=5)、肾癌(11.1%,n=4)、乳腺癌(11%,n=4)、胃癌(5.6%,n=2)和皮肤癌(2.8%,n=1)。观察到两种建模策略:(i)基于ML的放射组学直接预测预后或治疗反应(58.3%,n=21),和(ii)基于DL的流程用于相同任务(41.7%,n=15)。
肺癌是第二常见的恶性肿瘤,其中非小细胞肺癌(NSCLC)占病例的76%。表皮生长因子受体酪氨酸激酶抑制剂(EGFR-TKI)是EGFR突变NSCLC患者的标准一线治疗。最近基于DL的放射组学研究已超越常规CNN,转向更多样化的架构和多模态框架,旨在改善接受EGFR-TKI治疗的NSCLC患者的预后性能。例如,Hou等人应用迁移学习与3D-CNN,在EGFR突变患者中预测无进展生存期(PFS)的AUC达到0.744-0.794。将放射组学与临床数据整合进一步提高了性能:一个基于DeepSurv的组合模型在IIIB-IV期患者中,24个月PFS的AUC达到0.86,而单独使用放射组学为0.67。类似地,Wang等人将预后指数和临床数据纳入CoxCC模型,在伴有脑转移的晚期NSCLC患者中,九个月PFS的AUC达到0.87,而单独使用临床数据为0.70。这些发现凸显了临床变量(特别是吸烟状况)与放射组学特征整合后的附加价值。
为了克服这些限制,最近的研究集中于基于DL的语义特征提取以减少人工干预。例如,大规模双向生成对抗网络(BigBiGAN)可以自动提取高维语义特征。Song等人采用BigBiGAN框架预测IV期EGFR突变NSCLC患者的EGFR-TKI疗效,无需手动勾画,从而提高了效率和适用性。类似地,Wang等人引入了一个全自动AI系统(FAIS),分析原始CT扫描以预测肺癌亚型的EGFR突变亚型(AUC=0.813)和个体化PFS。
除了CNN,更新颖的架构如EfficientNetV2显示出潜力,通过提高准确性同时降低参数复杂性。Deng等人开发了一个基于EfficientNetV2的生存获益预后(ESBP)系统,将初级医师的诊断准确率从47.9%提高到66.3%,中级医师从53.1%提高到61.4%。然而,大多数研究仍然需要手动肿瘤分割和ROI选择,这些过程容易产生主观偏差并降低可重复性。
虽然DL方法主导了近期的研究,但在数据有限或异质性的肺癌背景下,ML仍然特别有价值。Zhu等人报告逻辑回归在测试模型中达到最高AUC(0.797),而Yang等人显示随机森林(RF)模型在反应预测中达到AUC 0.746。Zhang等人扩展了RF生存模型,结合瘤内和瘤周时间特征,在EGFR-TKI治疗的肺腺癌患者中,12个月时AUC达到0.96。
乳腺癌是全球女性中最常见的恶性肿瘤。抗HER2疗法显著改善了HER2阳性乳腺癌患者(约占所有乳腺癌病例的15-20%)的生存率。最近,新兴证据强调了放射组学与DL和ML技术整合在预测治疗效果和生存终点方面的变革潜力。Zhang等人开发了DeepTEPP,一个结合术前乳腺MRI放射组学与临床病理参数(如月经状态、手术信息、肿瘤状态和分子标志物)的DL框架。该模型在迄今为止最大的HER2阳性队列之一中得到验证,在预测接受单药或双药HER2靶向治疗患者的PFS和OS方面实现了高精度。扩展到MRI之外,He等人使用对比增强CT评估了六种ML放射组学模型,确定门静脉期ROI最具预测性,SVM达到最佳性能(AUC=0.865)。在新辅助治疗背景下,应用于乳腺MRI的基于ML的放射组学模型也预测了病理完全缓解(pCR),包括接受HER2靶向方案的患者,报告的AUC约为0.77。
肾细胞癌(RCC)的全球死亡率估计接近每年175,000例,发病率预计在未来十年内上升。靶向VEGF通路已成为晚期或转移性RCC(mRCC)的标准一线治疗。然而,高达30%的患者对TKI表现出内在耐药性,导致早期治疗失败。
放射组学提供了识别更可能从TKI获益的患者的机会。基线CT衍生的特征已被用于构建预测耐药性的ML模型:一项研究使用增强CT的3D肿瘤ROI,在转移性透明细胞RCC(mccRCC)中早期VEGFR-TKI耐药性的AUC达到0.81。基于此类方法,Chen等人开发了一个delta放射组学模型,准确预测了晚期RCC的短期TKI反应(AUC=0.916),而Negreros等人显示,将放射组学加入临床模型改善了预测,将AUC从0.90提高到0.94。
尽管有这些进展,依赖手工特征限制了鲁棒性。为了克服这一点,DL模型被探索:Yu等人应用基于CNN的框架能够自动提取特征,在RCC队列中预期寿命预测的准确率超过90%。这些结果突出了从传统的基于ML的手工放射组学向具有更大可重复性和临床转化潜力的DL模型的转变。
CRC是全球第二大致命癌症和第三大常见恶性肿瘤。CRC的治疗格局已被靶向药物重塑,EGFR和VEGF导向的单克隆抗体构成系统治疗的支柱,HER2作为一个新的可操作靶点出现。对于EGFR靶向治疗,Dercle等人应用RF模型预测早期敏感性,AUC高达0.80。对于VEGF导向治疗,Lu等人设计了一个混合CNN-RNN架构,在VELOUR试验中预测aflibercept单药治疗反应方面优于基于大小的网络。在一线贝伐珠单抗联合化疗(BBC)背景下,Maaref等人提出了一个使用基线CT的全自动DCNN框架,最佳模型AUC达到0.88。在此基础上,Chui等人证明ResNet模型可以进一步改善反应预测,正确识别了被放射科医生误判为无反应者的应答患者。对于HER2阳性CRC,Giannini等人开发了一个针对肝转移患者的ML模型,在预测HER2靶向治疗反应方面,每位患者的敏感性和特异性分别达到92%和86%。
肝细胞癌(HCC)预后差,5年生存率为18%,是全球最致命的恶性肿瘤之一。TKI如乐伐替尼和索拉非尼已被批准作为晚期HCC的一线治疗。例如,Bo等人开发了一个基于RF的放射组学模型,预测乐伐替尼单药治疗不可切除HCC的疗效,AUC达到0.96。鉴于TKI单药疗效有限,以及免疫检查点抑制剂(ICI)的兴起,联合方案日益成为晚期HCC的标准治疗。相应地,放射组学和AI模型已被应用于预测基于TKI的联合治疗反应。其中,一项结合20个超声特征的研究在预测TKI加抗PD-1治疗反应方面实现了稳健区分,独立验证队列(n=41)AUC为0.83。类似地,Liao等人将多期相CT与DL生成的热图结合,预测乐伐替尼加ICI治疗(CLICI)的结局,AUC达到0.802。除了ICI,其他新策略正在探索中。例如,索拉非尼已被证明可增强NK细胞为基础的过继免疫疗法(NK-ATI),MRI放射组学结合SVM算法在该联合治疗的早期评估中达到96%的准确率。
GC是第五大常见恶性肿瘤和第四大癌症相关死亡原因。人表皮生长因子受体2(HER2)过表达可在高达30.5%的GC患者中检测到,是GC的重要预后因素。抗HER2靶向治疗也已被证明是GC的实用治疗。尽管基于放射组学和AI直接预测GC预后的研究有限,但仍有一些潜力。He等人基于Transformer架构构建了一个DL模型,预测抗HER2靶向治疗的OS,AUC为0.894。另一项研究显示,
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号