
-
生物通官微
陪你抓住生命科技
跳动的脉搏
人工智能将CT图像与肾脏肿块的病理特征和生存结果联系起来
【字体: 大 中 小 】 时间:2025年02月08日 来源:Nature Communications 14.7
编辑推荐:
发表期刊:Nature Communications
发表时间:2024 年 6 月 5 日接收;2025 年 1 月 30 日录用;2025 年 2 月 7 日在线发表
DOI:https://doi.org/10.1038/s41467-025-56784-z
复旦大学附属中山医院泌尿外科的研究人员发现,偶然发现的肾肿瘤的治疗决策大多是在病理诊断不确定的情况下做出的。提高对良性肾肿瘤的诊断水平,并区分侵袭性癌症和惰性癌症,是优化治疗方案选择的关键。研究人员分析了 4557 例患者的 13261 个术前计算机断层扫描(CT)容积数据,并开发了两个多期卷积神经网络,以预测肾肿瘤的恶性程度和侵袭性。第一个诊断模型旨在预测肾肿瘤的恶性程度,在前瞻性测试集中,其曲线下面积(AUC)达到 0.871,超过了七位经验丰富的放射科医生的平均水平。第二个诊断模型用于区分侵袭性和惰性肿瘤,在前瞻性测试集中,其 AUC 为 0.783。这两个模型均优于相应的影像组学模型和肾计量评分列线图。研究表明,深度学习模型能够基于术前多期 CT 图像,以非侵入性的方式预测肾肿瘤发生恶性和侵袭性病理变化的可能性。
横断面成像技术的广泛应用,导致无症状的偶然发现的肾病变的检出率增加,同时,针对可疑恶性肾肿瘤进行的手术和消融治疗也在增多。然而,同期肾癌特异性死亡率并未显著下降,这表明可能存在对良性肾肿瘤的过度治疗,以及即刻切除手术的获益有限等问题。据报道,约 20% 的切除肾肿瘤为良性。因此,更准确地识别良性病变,有可能避免不必要的手术,以及与之相关的风险和并发症。如今,随着主动监测和消融等治疗策略的不断发展,仅仅知道肾肿瘤是良性还是恶性已不足以满足临床需求;了解其组织学特征是惰性还是侵袭性同样重要。事实上,许多恶性肾肿瘤的病程进展较为缓慢。对于特定患者,选择主动监测、消融还是手术治疗,取决于癌症特异性死亡风险与合并症相关死亡风险之间的个体化权衡。
计算机断层扫描(CT)和磁共振成像(MRI)是常用的肾肿瘤检测方法,但它们在评估肿瘤恶性概率和侵袭程度方面的准确性有限。经皮活检是另一种在治疗前获取组织学信息的方法。然而,经皮活检在 20% 的病例中无法得出诊断结果,在另外 10% 的病例中,其结果与切除组织的最终病理诊断存在差异。由于肾细胞癌(RCC)的肿瘤异质性较高,经皮活检在预测肿瘤细胞核分级、坏死和肉瘤样分化方面的准确性也相对较低。此外,这种侵入性操作会使患者面临出血、感染和种植转移等并发症的风险。
在大多数情况下,主动监测、经皮消融和手术切除之间的决策,是在缺乏可靠病理诊断的情况下做出的。因此,迫切需要提高对良性肾肿瘤的非侵入性诊断水平,并区分侵袭性肿瘤(需要积极治疗)和惰性肿瘤(可选择消融或延迟治疗)。基于人工智能(AI)的术前医学图像定量分析,在这一过程中可发挥关键作用。基于影像组学的机器学习模型已被用于评估肾肿瘤,并取得了一定的成果。然而,手工提取的影像组学特征存在固有局限性,例如缺乏上下文信息,且对肿瘤轮廓的变化较为敏感。相比之下,深度学习模型能够以端到端的方式从原始图像中学习分层特征。尽管近期有一些深度学习研究针对肾肿瘤进行了特征描述,但样本量较大、同时包括组织学亚型和国际泌尿病理学会(ISUP)分级的综合分析较少。
在本研究中,复旦大学附属中山医院泌尿外科等多单位的研究人员利用术前 CT 扫描数据开发了深度学习模型,以区分肾肿瘤的良恶性,以及惰性和侵袭性肿瘤。以往的诊断模型仅预测透明细胞肾细胞癌(ccRCC)的高级别病理特征,而此次的深度学习模型纳入了大多数肾肿瘤的病理亚型,并通过整合组织学亚型、肿瘤分级和不良病理特征,对肿瘤侵袭性进行了综合评估。研究人员进一步探究了 AI 预测的惰性和侵袭性肿瘤患者之间的生存差异,这在以往的研究中较少涉及。
患者招募流程见图 1A。研究共纳入 4557 例接受肾切除术且术前进行了增强 CT 扫描的患者,其中训练集有 2400 例患者,内部测试集有 598 例,外部测试集有 561 例,前瞻性测试集有 610 例,癌症影像存档与通信系统(TCIA)测试集有 388 例。各队列的详细临床病理信息见表 1。在训练集中,良性惰性肾肿瘤、恶性惰性肿瘤和恶性侵袭性肿瘤分别占病例总数的 16.8%、61.5% 和 21%。在内部测试集中,它们分别占 15.7%、62% 和 21.4%。在外部测试集中,15.9% 的患者患有良性惰性肾肿瘤,61.1% 的患者患有恶性惰性肿瘤,19.8% 的患者患有恶性侵袭性肿瘤。在前瞻性测试集中,恶性惰性肿瘤占 13.8%,恶性侵袭性肿瘤占 63.9%,恶性侵袭性肿瘤占 21%。在 TCIA 测试集中,这三种亚型分别占 3.6%、51% 和 45.4%(表 1)。图 1B 展示了不同数据集上各特定组织学分类的占比情况。
分割网络在勾画肾肿瘤方面表现出色(图 2B、E),骰子相似系数(DICE)得分为 0.852(表 S2)。基于裁剪后的图像,研究人员建立了一个多期卷积神经网络,以预测肾肿瘤的恶性程度。图 2A、D 分别列出了良性肾肿瘤(后肾腺瘤)和恶性肾肿瘤(透明细胞肾细胞癌)的代表性 CT 图像。图 2C、F 展示了良性和恶性肿瘤的类别激活图(CAM),可视化了神经网络在预测肿瘤恶性程度时图像中的重要区域。
分类性能总结见图 2,详细信息见表 S4。在内部测试集(图 2G)、外部测试集(图 2H)、前瞻性测试集(图 2I)和 TCIA 测试集(图 2J)中,区分恶性和良性肾肿瘤的 AUC 分别为 0.898、0.853、0.871 和 0.881。Alexander Kutikov 等人使用 R.E.N.A.L. 肾计量评分构建了两个列线图,用于预测 525 例肾肿瘤的恶性和高级别病理特征。此外,在以往的研究中,许多影像组学模型被提出用于区分良性和恶性肾病变。在本研究中,研究人员还分别开发了两个影像组学模型,作为两个深度学习模型的基准。在涵盖所有三个 CT 期相的三个测试集中,基于深度学习的诊断模型在预测肿瘤恶性程度方面,优于肾计量评分列线图和影像组学模型。
七位来自三级学术医疗中心、具有超过 5 年腹部 CT 影像阅读经验的放射科医生,在知晓每位患者的临床信息但不知晓组织病理学数据的情况下,对前瞻性测试集中肾肿瘤的 CT 图像进行评估。基于深度学习的模型表现优于七位专家放射科医生中的六位(图 2K)。具体而言,当该模型的敏感性与这些放射科医生的平均敏感性相匹配时,其特异性超过了他们的平均特异性。反之,当模型的特异性与他们的平均特异性相匹配时,其敏感性优于他们的平均敏感性(图 2K)。随后,研究人员比较了 AI 系统和阅片者在固定特异性以匹配阅片者表现时的敏感性,发现深度学习模型的表现显著优于四位放射科医生(表 S5)。当敏感性匹配时,深度学习模型的特异性高于六位放射科医生,但均未达到统计学显著性(表 S5)。研究人员进一步要求七位放射科医生重新评估前瞻性验证队列中的 CT 扫描图像,两次评估之间的最短洗脱期为两个月。此次,研究人员向放射科医生提供了深度学习模型的预测结果,并强调该模型的表现优于七位放射科医生的平均诊断能力。借助深度学习模型提供的额外信息,研究人员观察到放射科医生的诊断准确性显著提高(图 2L)。诊断相关性分析显示,七位放射科医生之间的诊断相似性高于深度学习模型(图 2M),这可能部分解释了为何在深度学习模型的辅助下,放射科医生的诊断准确性会提高。研究人员还测量了放射科医生评估第 101 至 200 例病例 CT 扫描图像的时间,并与他们最初的评估时间进行比较,发现评估 CT 扫描图像所花费的时间没有显著差异(图 2N)。
该诊断模型在实体瘤(图 S3A - D)、囊性肿瘤(图 S3E - H)和小肾肿瘤(SRMs)(图 S3I - L)的亚组分析中也表现出稳健的性能,并且优于影像组学模型和肾计量评分列线图。此外,研究人员开发了能够处理不同 CT 期相组合的额外诊断模型,并展示了两个深度学习模型在内部测试集中使用不同 CT 期相组合(非增强期(N)、动脉期(A)、静脉期(V)以及 N + A、N + V 和 A + V)时的 AUC(表 S6)。
除了恶性程度外,侵袭性在肾肿瘤的治疗中也日益重要。因此,研究人员试图开发第二个诊断模型,以区分惰性(良性和惰性、恶性和惰性)和侵袭性(恶性和侵袭性)肾肿瘤。惰性恶性肿瘤和侵袭性恶性肿瘤的分类主要基于 2022 年世界卫生组织(WHO)分类和以往的报告。为了确认分类的合理性,并了解所提出的侵袭性特征是否能转化为实际的生存差异,研究人员分析了中山队列和浙江队列中惰性和侵袭性恶性肿瘤之间的生存差异。两个队列的详细信息见表 S7。正如预期的那样,在中山队列(疾病特异性生存(DSS)、无复发生存(RFS)和总生存(OS)的 p 值均 < 0.001)和浙江队列(DSS、RFS 和 OS 的 p 值均 < 0.001)中,惰性肿瘤患者的生存时间均显著长于侵袭性肿瘤患者(图 S4)。
研究人员采用相同的网络架构,开发了另一个多期卷积神经网络,以预测肾肿瘤的侵袭性。分类性能总结见图 3,详细信息见表 S8。图 3A、D 分别展示了惰性肾肿瘤(黏液性管状和梭形细胞 RCC)和侵袭性肾肿瘤(未分类肾细胞癌)的代表性 CT 图像。图 3C、F 展示了惰性和侵袭性肿瘤的类别激活图,可视化了预测肿瘤侵袭性时图像中的重要区域。
除了肾计量评分列线图外,研究人员还开发了第二个标准化影像组学模型,作为另一个基准模型。在内部测试集(图 3G)、外部测试集(图 3H)、前瞻性测试集(图 3I)和 TCIA 测试集(图 3J)中,预测侵袭性病理的 AUC 分别为 0.792、0.763、0.783 和 0.755,高于影像组学模型和肾计量评分列线图在所有测试队列中预测高级别病理的 AUC。在亚组分析中,研究人员发现深度学习模型在实体瘤、囊性肿瘤和 SRMs 中均表现出稳健的性能,并且在所有亚组分析中均优于影像组学模型和肾计量评分列线图(图 S5)。有趣的是,与所有病例或其他亚组相比,影像组学模型和肾计量评分在 SRMs 中的 AUC 显著下降(图 S5)。不同 CT 期相的分类性能见表 S6。
研究人员在不同队列中验证了区分侵袭性和惰性肿瘤的诊断模型,证明了该诊断模型的稳健性和准确性。侵袭性评估的另一个重要方面是生存结果。因此,研究人员比较了 AI 诊断模型预测为惰性肿瘤(AI 预测惰性)的患者和预测为侵袭性肿瘤(AI 侵袭性)的患者的肿瘤学结局。研究人员发现,在内部测试集(DSS,p<0.001,风险比(HR)=5.48;RFS,p<0.001,HR=4.11;OS,p = 0.005,HR=2.66)和外部测试集(DSS,p<0.001,HR = 20.61;RFS,p<0.001,HR=9.69;OS,p<0.001,HR=13.19)中,AI 预测惰性肿瘤和 AI 预测侵袭性肿瘤的患者在 DSS、RFS 和 OS 方面存在显著的生存差异(图 4A - F)。在训练集中也观察到了类似的趋势(图 S6)。用于生存分析的训练集、内部测试集和外部测试集中恶性肾肿瘤患者的基线特征见表 S7。在内部测试集中,AI 预测惰性肿瘤患者的 5 年生存率为:DSS 为 97.9%,RFS 为 94.5%,OS 为 96.8%;AI 预测侵袭性肿瘤患者的 5 年生存率为:DSS 为 86%,RFS 为 77.2%,OS 为 85.1%。在外部测试集中,AI 预测惰性肿瘤患者的 5 年生存率为:DSS 为 99.6%,RFS 为 96.8%,OS 为 98.9%;AI 预测侵袭性肿瘤患者的 5 年生存率为:DSS 为 79.6%,RFS 为 74.6%,OS 为 79%。
![图 4 AI 预测的侵袭性与生存结果之间的关联](https://pic3.zhimg.com/v2-867575757
生物通微信公众号
知名企业招聘