综述:肾脏成像中人工智能的前沿综述

【字体: 时间:2025年04月29日 来源:Abdominal Radiology 2.3

编辑推荐:

  本文聚焦肾脏成像中人工智能(AI)的应用,涵盖肾肿瘤诊断、分级等多方面。阐述 AI 在肾病变检测、分型的成果与局限,探讨基础模型等新技术及监管审批,为深入研究 AI 在肾脏医学领域的应用提供全面参考。

  

引言


肾细胞癌(RCC)是一个重大的健康问题,其发病率近年来以每年约 2% 的速度稳步上升,主要归因于横断面成像技术的广泛应用,使得偶然发现的肾脏病变增多。在接受腹部成像检查的人群中,约 27% 的人会检测出偶然发现的肾脏病变。而且肾脏肿瘤具有多种组织学亚型,每种亚型在发病率、预后特征和治疗方案上都有所不同,准确区分这些亚型具有挑战性。人工智能(AI),特别是机器学习(ML)和深度学习(DL)技术,在放射学分析中展现出巨大潜力,为肾脏病变的检测、分割和分类提供了先进工具,有望改善诊断并实现个性化治疗。

肾脏肿瘤


在评估肾脏肿块时,首要步骤是区分良性囊肿和实性肿块。大多数囊性肾脏肿块是良性的,即便为恶性,生长也较为缓慢。Bosniak 分类系统是目前用于对囊性肾脏肿块的恶性风险进行分类的常用平台。而在实性肾脏肿瘤中,高达 90% 为恶性,包括透明细胞肾细胞癌(ccRCC)、乳头状肾细胞癌(papRCC)等,血管平滑肌脂肪瘤(AML)和嗜铬细胞瘤则是常见的良性实性肾脏肿块。在诊断和表征肾脏肿块方面,成像技术至关重要,然而,超声(US)虽能识别多数偶然发现的肾脏肿块为简单囊肿,但难以区分良性和恶性实性肾脏肿瘤。多数肾脏肿块是在进行非泌尿系统相关的基线超声或静脉期计算机断层扫描(CT)时偶然发现的,除典型的简单囊肿和含脂肪的 AML 外,准确表征这些肿块通常需要进行专门的 CT 或磁共振成像(MRI)扫描,并使用静脉造影剂。

人工智能、机器学习和深度学习的介绍及区别


人工智能是计算机科学的一个广泛领域,旨在创建能够执行通常需要人类智能的任务的系统。机器学习是计算机科学的一个分支,专注于让计算机在没有明确编程的情况下 “学习”,可分为监督学习和无监督学习。监督学习类似于流行病学研究中的模型拟合技术,需要为每个观察指定结果值(即 “标签” 或 “目标”),使用标记数据进行学习,涵盖传统流行病学方法和常用的机器学习算法。无监督学习则是算法在数据中寻找自然关系和分组,无需参考特定结果或 “正确答案” 。

深度学习是机器学习的一个专门领域,利用多层人工神经网络(常称为 “深度” 网络)来建模和分析复杂的数据模式。它在图像和语音识别等需要复杂手动特征提取的任务中表现出色,其特征层由数据自动衍生,而非人工制造。在肾脏成像中,深度学习通过卷积神经网络(CNNs)等先进神经架构,能够自动对肾脏病变进行分割、检测和分类,有助于提高诊断准确性和制定个性化治疗方案,还能实现对肿瘤特征的非侵入性评估,减少对侵入性手术的需求。

分割


肾脏 MRI 扫描中的肾脏分割是一项耗时的工作。在医学图像分析中,图像分割是提取相关对象或区域、确定组织特征和提高诊断精度的基础步骤。在临床实践中,肾脏分割对于评估病变大小和体积等重要参数、制定临床决策、评估治疗策略和规划干预措施具有重要意义。手动分割由经验丰富的专家进行,是肾脏分割的金标准方法,但极为耗时。常用的手动分割图像编辑应用包括 ITK - SNAP、Analyze 等。

基于图像处理和模型的分割方法众多。阈值分割是一种简单的分割技术,通过将像素强度值与阈值比较来分离感兴趣区域,如 Rosin 等人提出的单峰阈值分割法,Sandmair 等人利用该方法评估慢性肾病(CKD)患者的总肾脏体积(TKV),结果显示半自动分割与手动分割的体积存在 1.5ml 差异。区域生长法从肾脏内选定的种子点开始,根据区域特征自动学习同质性标准,逐步添加相邻相似像素直至完成分割,但在分割单个肾囊肿时可能仍需人工干预。边缘检测用于识别图像中物体的轮廓和物体与背景的边界,Gui 等人将其应用于超声成像中的肿瘤分割,取得了一定效果。分水岭分割基于地理分水岭动态原理,将图像划分为不同区域,对复杂相邻结构的分割效果较好,但容易出现过分割现象,常需额外处理来优化结果,如 Schmidt 等人利用该方法分离多个共边界的囊肿并结合全局阈值技术优化边界。主动轮廓模型(ACM)是一种复杂的图像分割算法,结合灰度和边缘信息,以能量函数最小化来实现稳定的分割结果,Pandy 等人将其与 3 - D Unet 结合用于肾脏肿瘤分割。水平集方法用于跟踪界面的演化,在图像分割、重建和去噪等方面有重要应用,Shehata 等人利用该方法进行 3D 肾脏分割,不同引导方式下的 DICE 系数有所不同。基于图像配准的分割方法,如基于图谱的分割(ABS),通过将预标记的参考图像(图谱)与目标图像配准,实现解剖结构的自动分割,Zhao 等人利用多图谱配准(MAR)在 Micro - CT 图像上进行肾脏分割,取得了较高的 Dice 系数。

深度学习框架如 U - net 和卷积神经网络(CNN)在临床图像的器官分割分析中应用广泛。基于卷积神经网络的自动肾脏分割技术发展迅速,常见模型包括 U - Net、nn - Unet、YOLO v8 等,这些模型在肾脏分割任务中展现出良好的效果。

肾脏肿块的鉴别


机器学习和放射组学


多种成像技术在肾细胞癌的诊断中都很重要。超声可作为有效的筛查工具,区分实性和囊性肾脏病变,但确诊则需更复杂的成像技术,如 CT 或 MRI。然而,这些图像的解读在很大程度上依赖于放射科医生的主观经验。放射组学通过结合体素、纹理和直方图分析等参数,从传统 CT 或 MRI 图像中提取更多肉眼难以察觉的详细信息,有望提高诊断准确性,其流程包括图像采集、感兴趣体积识别、分割、定量数据提取和数据库构建等,在肿瘤学领域的癌症检测、诊断和预后评估以及治疗反应监测等方面正发挥着越来越重要的作用。

在肾细胞癌的诊断中,区分良性和恶性病变以避免过度治疗是一个重要挑战。基于放射组学的机器学习模型可作为非侵入性工具辅助临床决策。肾细胞癌主要包括透明细胞肾细胞癌、乳头状肾细胞癌和嫌色细胞肾细胞癌(chRCC)三种亚型,它们在细胞组成和血管分布上存在差异,其中透明细胞肾细胞癌最为侵袭性和致命,亚型分类对于指导分子靶向治疗具有重要意义。多项研究报道了放射组学在肾细胞癌亚型分类中的应用,不同研究采用不同的算法和成像数据,取得了不同程度的成果,但也存在样本量小、结果易受偏倚影响等问题。此外,一些研究还探索了放射组学与基因的关联,如 Li 等人构建的结合成像特征与 VHL 突变基因的模型,在区分透明细胞肾细胞癌与其他肿瘤亚型方面取得了较高的 AUC 和准确率。

深度学习


深度学习在肾脏肿块的鉴别中也发挥着重要作用。Yazdian 等人评估了 YOLOv7 在检测肾癌方面的有效性,在不同维度的评估中取得了一定的阳性预测值、灵敏度和 F1 分数。Xu 等人对比了基于放射组学的模型(包括随机森林和深度学习)与放射科医生的评估,发现深度学习与放射组学相结合在 T2 加权成像(T2WI)和扩散加权成像(DWI)上均取得了较高的诊断准确性,超过了放射科医生的评估结果。Lin 等人比较了深度学习模型与经验丰富的放射科医生对肾脏肿瘤良恶性的分类能力,结果表明 AI 在肾脏病变特征描述上与资深放射科医生相当,且在灵敏度上略胜一筹。Dai 等人在多中心研究中直接对比了深度学习模型与放射科医生的表现,发现 AI 在区分良性和恶性肾脏肿块方面与经验丰富的放射科医生相当,即使对于小肿瘤也能保持较好的性能。Han 等人利用深度学习神经网络对不同亚型的肾细胞癌进行分类,取得了较高的 AUC。Tanaka 等人利用 Inception - v3 卷积神经网络架构在多期增强 CT 上区分小肾脏肿块,发现深度学习模型的准确性相对较高。

肿块的 Fuhrman 分级


1982 年,Fuhrman 等人提出了一种组织学分级系统,通过评估肿瘤细胞核的大小、形状和核仁突出程度来对肿瘤进行分级,Fuhrman 分级范围为 1 - 4 级,级别越高表示肿瘤越具侵袭性和低分化。Fuhrman 分级与患者预后密切相关,术前评估肾细胞癌的肿瘤侵袭性对于制定最佳治疗方案和选择合适的随访方案至关重要。

目前有多种策略用于术前非侵入性预测透明细胞肾细胞癌的 Fuhrman 分级。MRI 衍生的 ADC 值可作为肿瘤活性的指标,多项研究评估了其在区分低级别和高级别透明细胞肾细胞癌中的作用,但 MRI 的可用性和 ADC 值的可靠性仍需进一步验证。基于 CT 的半定量和定量研究也尝试对低级别和高级别透明细胞肾细胞癌进行分类,放射组学方法通过将医学图像转化为定量、高维且可挖掘的特征,为预测肿瘤状态提供了可能。多项研究利用不同的算法和成像数据,从不同角度对肾脏病变的 Fuhrman 分级进行预测,取得了一定的成果,但也存在一些局限性。深度学习模型在肾脏病变的 Fuhrman 分级中也有应用,基于 CT 或 MRI 的深度学习模型在常规临床环境中对透明细胞肾细胞癌分级的准确率可达 73.7 - 88%,部分基于其他成像方式的模型也表现出了一定的潜力。

基础模型、大语言模型和大视觉语言模型


基础模型是在大量数据集上预训练的大规模 AI 模型,正迅速推动医学成像领域的发展。与传统的特定任务模型不同,基础模型学习的是广泛的、可转移的表示,可适应各种问题。通过自监督学习,这些模型能够利用未标记图像,结合基于 Transformer 的架构和多模态训练,使其具备对医学成像的 “常识” 理解。

在诊断方面,预训练的视觉模型具有零样本诊断能力,能够识别未明确训练过的异常情况。例如,名为 “Merlin” 的视觉语言基础模型在超过 600 万张腹部 CT 图像及相关放射学报告和临床代码上进行训练,无需特定任务重新训练,就能以零样本方式对 CT 扫描中的多种成像结果进行分类,其平均 F1 分数达到约 0.74,优于专门设计的放射科医生分类器。大语言模型(LLMs)和大视觉语言模型(LVLMs)可用于解释肾脏成像结果并辅助诊断,能够分析肾脏图像并识别肿瘤、囊肿等病理情况,还能发现放射科医生可能遗漏的细微异常。例如,ChatCAD 等集成框架将大语言模型与专门的图像分析网络相结合,可对放射学图像进行解释并生成诊断报告,为临床决策提供支持。

在分割方面,LVLMs 在肾脏结构和病变的自动图像分割中发挥着重要作用。Meta 的 Segment Anything Model(SAM)等基础模型展示了提示驱动的分割能力,只需极少的用户输入就能勾勒出所需结构,且在多器官医学图像上表现出出色的零样本性能,无需针对特定器官进行训练。通过将分割结果与 LLMs 集成,系统能够生成关于肿瘤大小、位置和范围的文本描述,并融入到报告中。

在预后和结果预测方面,通过分析成像模式并结合临床数据,LLMs 和 LVLMs 有助于预测疾病的结果或进展。在肾脏成像中,这意味着可以预测肾脏肿瘤的生长或肾功能的下降。未来的 LVLMs 有望通过评估成像生物标志物,如病变纹理或灌注模式,来估计肿瘤的侵袭性或患者的生存概率,为治疗规划和患者咨询提供帮助。

在工作流程自动化方面,LLMs 有潜力简化肾脏成像工作流程的多个步骤,从图像采集到报告生成。其中一个重要应用是自动报告生成,LLMs 能够根据成像结果生成连贯的放射学报告或印象部分,节省放射科医生的时间并确保重要发现得到准确记录。此外,LLMs 还能从先前的报告或电子健康记录中提取信息,为临床决策提供更全面的依据。

确保肾脏成像中 AI 模型的泛化性


肾脏成像的 AI 模型需要在不同的数据集、扫描仪和临床环境中具有泛化能力。这需要采用多种技术,包括迁移学习、联邦学习、多中心验证和图像归一化等。

迁移学习通过利用一个成像数据集或协议中的知识来提高在另一个数据集或协议上的性能。例如,在肾脏成像中,将在一种 MRI 序列(如对比增强 T1 加权 MRI 序列)上预训练的 U - Net 分割模型,针对其他 MRI 序列(如 T2 加权、同相位、反相位、预对比、皮质髓质期)进行微调,可提高肾脏分割的准确性,平均 Dice 分数相比从头开始训练单独的模型提高约 3%。

联邦学习是一种允许多个机构在不共享原始数据的情况下协作训练 AI 模型的方法,能够保护患者隐私。通过从广泛的数据来源学习,有望产生更准确、泛化性更强的 AI 模型。例如,Kaissis 等人展示了一种基于联邦学习的隐私保护深度学习框架,应用于多机构医学成像数据。

多中心验证对于验证肾脏成像 AI 模型的泛化能力至关重要。由于模型通常最初在单机构或有限的数据集上进行训练,在来自不同医院或扫描仪的外部数据集上进行测试,可以检验模型的实际性能。例如,在一项针对常染色体显性多囊肾病(ADPKD)的自动肾脏和肝脏体积测量的多中心研究中,Woznicki 等人在多个站点的 992 次 MRI 扫描上训练深度学习模型,然后在来自其他中心的 93 名患者的测试集和 323 名患者(831 次 MRI 扫描)的大型外部队列上进行评估,结果显示该模型在不同的 MRI 扫描仪数据上都表现出较高的准确性和稳健性。

图像归一化旨在减少扫描仪硬件和成像协议差异带来的可变性,使来自不同站点的输入对模型来说更加一致。常用的统计方法如 ComBat 算法,最初用于去除高维数据中的批次效应,现已应用于医学成像领域。例如,在一项多机构的透明细胞肾细胞癌放射组学研究中,研究人员对从七个机构使用三种不同扫描仪获取的 CT 图像应用 ComBat 归一化,调整了站点和扫描仪的影响,确保预测模型不受扫描仪差异的干扰。此外,深度学习也提供了强大的图像到图像转换工具用于图像归一化。

监管审批流程


在美国,FDA 将 AI 驱动的成像工具归类为医疗器械(通常为软件即医疗器械,SaMD),并对其进行严格的上市前审查,以确保安全性和有效性。2019 年至 2023 年年中,FDA 批准了近 700 种 AI 支持的医疗器械,其中超过 75% 用于放射学领域。这些器械通常通过 510 (k) clearance 或 De Novo approvals 等途径获得批准,需要证明 AI 技术能够改善或等同于标准治疗。FDA 还强调良好机器学习实践指南(与英国 MHRA 和加拿大卫生部联合制定),以确保 AI 设备的稳健开发和风险管理。此外,FDA 引入了 “预定变更控制计划”(PCCP),允许在批准后对学习算法进行安全更新。

在欧洲,AI 成像工具属于欧盟医疗器械法规(MDR 2017/745)的监管范围,需要获得 CE 标志才能上市。除了最低风险的软件(I 类)外,大多数 AI 诊断工具至少属于 IIa 类或更高类别,必须经过指定机构的评估。合规要求包括证明临床性能、风险控制以及满足软件生命周期标准(如医疗软件的 IEC 62304 标准)。在实际操作中,获得 CE 标志通常被认为比 FDA 批准更快、要求相对较低,因此一些公司会先在欧洲或其他地区推出 AI 产品,同时继续申请更耗时的 FDA 批准。

当前局限性和未来展望


尽管 AI 在肾脏成像领域具有广阔前景,但放射组学仍面临一些限制,影响其临床应用和泛化性。输入数据的质量和放射组学分析中使用的参数会显著影响结果的准确性,例如 MRI 中的信号强度即使在相同扫描条件下也可能存在差异,从而影响放射组学特征的可靠性。此外,只有少数已发表的放射组学研究具有可重复性,这主要是由于放射组学工作流程复杂且涉及多个步骤,同时研究方法和结果的报告不充分也限制了对其的评估和传播。放射组学模型的可解释性也是一个问题,其生成的预测结果难以从临床角度进行有意义的解释,虽然可解释 AI(XAI)技术如显著性图、Grad - CAM、SHAP 值和注意力机制等可提高透明度,但这些方法的可靠性仍需进一步研究。Publication bias 也是一个重要问题,只有少数负面结果被发表,这可能导致对放射组学有效性和可靠性的高估。另外,过拟合也是一个主要问题,特别是在小样本或同质性较高的数据集上训练的模型,容易出现过度记忆训练数据而无法学习通用特征的情况,需要采用正则化技术和外部验证来确保模型的稳健性。

数据集偏差也是一个关键限制因素,AI 模型往往学习训练数据的特征,而不是通用的成像特征。例如,在单中心数据集上训练的模型在应用于不同扫描仪、造影剂或患者群体的图像时,性能可能会下降。联邦学习和域适应技术有助于解决这一问题,但要实现真正的泛化,还需要在训练数据中纳入更多样化的患者群体和罕见的肾脏肿瘤亚型。

深度学习模型在医学领域

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号