使用多模态真实世界数据和可解释的人工智能解码泛癌症治疗结果

【字体: 时间:2025年01月31日 来源:Nature Cancer 23.5

编辑推荐:

  Keyl等人提出了一项可解释的基于人工智能模型的现实世界数据分析,该数据来自38种癌症类型的15,000多名患者,确定了关键的预后标志物相互作用,并在外部肺癌队列中证实了这些相互作用。

  

多模态真实世界数据与可解释人工智能解码癌症治疗结果研究解读


德国埃森大学医院(University Hospital Essen)的 Julius Keyl、Philipp Keyl 等研究人员在《Nature Cancer》期刊上发表了题为 “Decoding pan-cancer treatment outcomes using multimodal real-world data and explainable artificial intelligence” 的论文。该研究借助多模态真实世界数据和可解释人工智能(xAI),深入剖析癌症治疗结果,为临床决策支持引入 AI 衍生(AID)标记,这一成果对推动个性化癌症医疗发展意义重大,有望改变临床变量评估方式,实现数据驱动的精准癌症治疗。


一、研究背景


尽管精准肿瘤学已取得一定进展,但临床决策目前仍依赖有限的变量和专家知识。现代医疗中,虽然每位患者都积累了大量多模态临床数据,但个性化医疗的目标尚未达成。单标记研究无法充分揭示影响患者预后的患者特异性和肿瘤特异性变量间的复杂相互作用,导致许多相关工具未在临床实践中得到应用,或未能全面考虑反映患者独特疾病背景的临床数据。


整合多源临床数据,如病史、实验室检测结果、影像数据和组学分析,成为克服这一局限的可行策略。机器学习的发展和数字化数据的日益丰富,使得大规模建模预后标记间的复杂关系成为可能。结合可解释人工智能(xAI)方法,能够评估个体患者的预后,并阐明每个变量的作用,为深入研究癌症治疗结果提供了新途径。


二、研究材料和方法


(一)研究对象


研究人员回顾性评估了德国埃森大学医院 150,079 例癌症患者的电子健康记录,最终纳入 15,726 例在 2007 年 4 月至 2022 年 7 月期间接受全身癌症治疗的患者进行分析。这些患者涵盖 38 种癌症实体,包括肺癌、肉瘤、乳腺癌等多种常见癌症类型。同时,研究使用了美国 Flatiron Health 提供的全国性电子健康记录衍生的去识别数据库中的 3,288 例非小细胞肺癌患者数据作为外部验证队列。


(二)数据采集


研究数据源于埃森大学医院的智能医院信息平台(SHIP),包括癌症治疗药物、人口统计学信息、身体成分数据、癌症实体信息、既往诊断、医疗干预、分期、转移位置、生命体征、ECOG 体能状态评分、实验室结果、病理信息、吸烟状态等多方面数据。针对不同类型数据,设定了不同的查询时间窗口,以确保数据的时效性和完整性。此外,从 SHIP 自动提取总生存期(OS)和下次治疗时间(TTNT)作为研究终点。


(三)数据预处理


对连续变量,去除超过均值 3 个标准差的异常值,并进行标准化处理,使其均值为 0,方差为 1。对分类变量,如 ECOG PS 按 0 - 4、转移情况按 0 - 1 进行有序编码;对诊断(ICD 代码)、癌症实体、干预(OPS 代码)和全身癌症治疗等进行独热编码。针对存在缺失值的变量,采用特征扩展方法处理,将缺失值设为 (0,0) 。外部数据集也进行类似的预处理操作。


(四)模型构建与训练


采用与 DeepSurv 类似的 coxph 架构和 pycox 生存库中的训练方法构建模型。每个变量作为输入,进入具有一个隐藏层且隐藏层宽度为输入神经元 10 倍的全连接神经网络。运用五折交叉验证,在每折训练中,用 80% 的数据训练两个神经网络分别预测 OS 和 TTNT 的风险评分,10% 的数据用于调整超参数和提前停止模型训练,10% 的数据用于计算一致性指数(C-index)。模型训练使用 Adam 优化器,初始学习率为 0.01,最多训练 50 个 epoch,若提前停止,则将学习率降至之前的 1/10,继续训练 50 个 epoch,直至学习率降至 1e - 4,训练中采用 0.5 的随机失活率(dropout rate)和 1024 的批量大小。


(五)可解释性分析


运用层式相关传播(LRP)方法对模型预测进行解释。LRP 基于神经网络结构,从预测结果出发,通过传播规则逐层反向分配相关性,最终在输入层得到每个输入特征(变量)对预测的贡献。将 LRP 分配给特定输入的分数视为该标记对患者总体预后(OS 或 TTNT)的风险贡献(RC),通过计算所有患者中标记的绝对 LRP 分数之和除以该标记非缺失患者数,得到标记重要性(MI)。


三、研究结果


(一)队列定义


最终纳入分析的 15,726 例患者中,女性占 44.3%。常见癌症类型为肺癌(n = 4,320)、肉瘤(n = 1,578)和乳腺癌(n = 1,223)。7,349 例患者(46.7%)用于计算 OS 时进行了删失处理,5,638 例患者(35.9%)用于计算 TTNT 时进行了删失处理。基线时,7,965 例患者有结构化的转移状态(M 状态)数据,其中 5,606 例为转移性疾病(M1),2,359 例为局部或局部晚期癌症(M0)。5,395 例患者在治疗前通过腹部 CT 图像自动评估了身体成分。研究共纳入 350 个变量,全面描述了患者首次全身治疗前的特征。


(二)泛癌模型预测结果


训练的两个神经网络在泛癌数据集上预测 OS 的平均 C-index 为 0.762,预测 TTNT 的平均 C-index 为 0.711。在对至少 20 例患者的每个癌症实体进行独立测试时,模型预测性能有所差异,如眼癌预测 OS 的 C-index 最高(0.804),直肠癌预测 TTNT 的 C-index 最高(0.756)。与单癌种训练模型相比,泛癌数据集训练的模型在预测 OS 和 TTNT 时,性能显著提升(OS:单癌种模型平均 C-index 为 0.72,泛癌模型为 0.75,P <0.001;TTNT:单癌种模型平均 C-index 为 0.68,泛癌模型为 0.70,P < 0.001),仅黑色素瘤患者在单癌种训练时结果略优于泛癌训练(P> 0.05)。此外,泛癌模型在与常见预后评分系统的比较中表现更优,如优于 UICC 分期、ECOG 体能状态评分、Charlson 合并症指数和改良格拉斯哥预后评分等。在与基于 10 个自动选择变量的简化 Cox 模型比较时,泛癌 xAI 模型在完整训练数据集和各癌症类型上的平均 C-index 均更高(P < 0.001)。


(三)xAI 揭示标记间复杂预后关系


通过 LRP 分析,发现不同临床变量对预后的影响不同。例如,年龄增长和 C 反应蛋白(CRP)水平升高强烈预示不良预后,而高 fT3、高 PD - L1 肿瘤比例评分(TPS)和较高的 CT 衍生腹部肌肉体积则预示良好预后。利用外部非小细胞肺癌患者数据验证,发现内部和外部数据集的 RC 线性化斜率高度相关(Pearson’s r = 0.9,P < 0.001),且 xAI 预测的标记对患者风险的影响在两个数据集上具有可比性。同时,xAI 计算的标记关系与传统 Cox 模型的风险比也高度相关(内部数据集:Pearson’s r = 0.93,P < 0.001;外部数据集:Pearson’s r = 0.97,P < 0.001)。研究还发现,标记间存在复杂的相互作用,在 8,294 对检查的标记对中,1,373 对(16.6%)显示出显著相互作用。如 CRP 的 RC 受血小板计数影响,高 CRP 水平在血小板计数低时对预测风险影响更大,而在血小板计数高时影响较小;血尿素氮(BUN)对 CRP 的 RC 也有影响,高 BUN 水平下,较高的 CRP 水平与更高的 RC 相关;而 CRP 的 RC 与天冬氨酸转氨酶(AST)无关。内部和外部数据集变量间的显著相互作用在外部数据集中具有较高相似性(Pearson’s r = 0.59,P = 0.021),且 xAI 推导的相互作用方向与 Cox 回归模型观察到的一致(内部数据集:r = 0.91,P = 0.03;外部数据集:r = 0.69,P = 0.009)。


(四)AID 标记用于患者级治疗指导


AID 标记结合了标记值及其 LRP 分配的 RC,为医疗专业人员提供了更丰富的临床信息。通过 “临床医生指南” 展示了四位不同患者的 AID 标记情况,如患者 1 的年龄、BMI、体重和 fT3 值对总体预后产生不利影响,而高淋巴细胞和血小板计数则具有有利影响;患者 3 中,虽然传统认为 CRP 水平升高需密切监测,但由于其高血小板计数和低尿素氮水平,xAI 认为该变量在该患者中并非有害。这些结果表明 AID 标记能更全面地反映患者情况,辅助临床决策。


(五)评估既定评分系统


研究分析了常见评分系统与 LRP 分配的 RC 之间的相关性,发现 ECOG PS(r = 0.87)、M 分期(r = 0.92)和 N 分期(r = 0.76)的评分与计算的 RC 平均相关性较高,表明这些评分对预后的影响相对独立于其他标记;而肿瘤分级(r = 0.02)和 T 分期(r = 0.07)与 RC 的相关性较弱,提示它们应结合其他标记进行解释,进一步说明了单标记预后预测的局限性。


(六)队列水平标记重要性评估


计算标记重要性(MI)发现,350 个标记中,114 个最重要的标记贡献了 90% 的 LRP 分数。在所有患者中,预测 OS 最重要的标记包括 CRP、fT3、ECOG PS、M 分期和 LDH 等。此外,研究还发现不同合并症和医疗干预对预后的影响,如疼痛、呼吸异常等合并症对预测不良预后贡献较大,而输尿管支架置入和脑膜重建等干预措施的 RC 较高。


(七)预后标记的跨队列比较


通过在泛癌数据集上训练模型和 LRP 分析,研究发现一些已明确与特定癌症预后相关的标记,如 CA19 - 9 在小肠、胆道癌症中 MI 最高,胆红素对肝、胰腺和胆道癌症至关重要等。同时,也发现了许多新的预后关联,如腹部肌肉体积对外阴、子宫和睾丸癌预后重要,AST 对尿道癌预后分层重要等。


(八)疾病进展过程中标记重要性的演变


对死亡患者按 OS 排序,观察标记重要性在疾病进展过程中的变化。发现 ECOG PS、CRP 和 LDH 水平在疾病进展中始终是重要的预后标记;总血清蛋白浓度对短 OS 患者预后影响较大,反映了疾病晚期器官功能障碍的相关性;凝血变量凝血酶原时间和氧饱和度在短 OS 患者中预后作用显著,但在长 OS 患者中作用较小;M 分期总体重要性高,但在短 OS 疾病阶段重要性降低。在肺癌、睾丸癌、黑色素瘤、肝癌等不同癌症中,多种标记的重要性在疾病进展过程中呈现不同变化趋势,且不同癌症特异性生物标志物在预后中的重要性也有所不同,如 PD - L1 TPS 对肺癌预后至关重要,SCC 在头颈部癌疾病进展中重要性增加,AFP 在肝癌全程重要,而 CA19 - 9 和 CA125 在肝癌晚期变得更为重要。


四、研究结论与讨论


本研究利用多模态真实世界数据和 xAI,对 15,726 例实体癌患者的预后机制进行了深入探究。研究结果表明,训练模型时纳入不同癌症实体患者的数据,有助于模型学习跨癌症的预后关系,成功将患者分层为跨癌症风险组。xAI 能够全面分析影响治疗结果的因素,在无需先验知识的情况下,确定 CRP、fT3、M 状态和 ECOG PS 等为影响患者预后的关键因素,且研究结果在内部和外部数据集间具有良好的可重复性,与传统方法高度一致。


与传统基于有限标记的评分系统不同,xAI 结合多模态患者数据,不仅能进行风险分层,还能为临床医生提供具有双重维度的 AID 标记,辅助调整治疗强度和制定个性化治疗目标。随着现代医院基础设施能够实时采集患者数据,该研究方法有望无缝融入临床常规护理。


然而,研究也存在一定局限性。回顾性真实世界数据分析中存在混杂因素,如相关变量导致的混杂、记录引入的混杂以及选择偏倚等问题。虽然研究采取了一些措施减少混杂影响,但仍需进一步改进。此外,研究仅纳入了接受全身癌症治疗的患者,外部验证数据集仅为非小细胞肺癌患者,未来需纳入更多不同癌症类型的外部数据进行验证。在解释不同治疗的 RC 时也需谨慎,因为治疗的非随机选择可能导致统计偏差。


总体而言,该研究展示了基于 xAI 的大规模多模态数据分析在真实世界中研究预后关系的潜力。随着多模态数据在患者管理和治疗选择中作用日益凸显,xAI 方法有望为精准医学发展提供强大支持,推动癌症治疗向个性化、精准化方向迈进。但在实际临床应用前,还需进一步完善研究方法,克服现有局限性,确保研究结果的可靠性和有效性。


相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号