探索影像组学复杂性:基于MRI预测直肠癌治疗反应的机器学习流程深度分析
【字体:
大
中
小
】
时间:2025年09月28日
来源:Cogent Social Sciences 1.6
编辑推荐:
本综述系统评估了多中心MRI影像组学(Radiomics)流程中不同技术决策对预测直肠癌(RC)治疗反应的影响,强调了预处理(如z-score标准化)对特征可重复性的关键作用,并指出特征选择(FS)比机器学习(ML)分类器复杂度更具影响力。研究为开发稳健且可临床转化的影像生物标志物提供了重要方法论指导,尤其针对高度不平衡数据集的处理提出了实践见解。
影像组学生物标志物的开发因不同中心的成像协议差异和缺乏标准化方法而面临挑战。本研究利用来自六个中心的多参数磁共振成像(MRI)数据,评估了影像组学流程中不同技术决策对预测直肠癌治疗反应的影响。分析了预处理、特征提取、标准化策略和机器学习(ML)模型的鲁棒性和泛化能力。主要发现表明,预处理显著增强了特征的可重复性,且特征选择的重要性超过了ML分类器的复杂性。该分析强调了在实际环境中开发独特流程的必要性以及影像组学生物标志物的复杂性,尤其是在处理高度不平衡数据集时。研究提出了若干见解和方法,以支持在实施影像组学系统时做出更明智的决策。未来的工作应侧重于整合临床、基因组和病理组学数据,以提高预测能力并促进其引入临床实践。
过去十年中,开发人工智能(AI)系统以辅助临床医生进行肿瘤医学成像的兴趣显著增加。这些发展已取得鼓舞人心的成果,表明基于AI的技术可用于自动图像分割和检测。然而,更具挑战性的任务,如开发预后成像生物标志物以表征肿瘤或预测治疗反应,仍因多种原因而受限,包括缺乏多中心和广泛的外部验证。其中一个主要因素不仅是国际合作的缺乏,还包括缺乏能够应对不同中心图像固有差异的标准化方法。事实上,使用不同协议和设备获取的患者图像之间存在不可避免的高度变异性,严重限制了结果的可重复性、可重复性和泛化性,引入了不一致性,阻碍了结果的可解释性。
因此,为了开发稳健且可能转化为临床的影像组学生物标志物,必须仔细分析几个重要步骤,并就这些步骤做出深思熟虑的决策。这些决策包括最小化多中心数据库特有的不必要的变异性,识别最具信息性和代表性的数据,以及开发最适合每个任务的AI模型。然而,尽管一些研究解决了泛化问题,主要是在脑和心脏MRI的基于深度学习的分割任务上,但评估各种方法选择对基于ML的多中心生物标志物的鲁棒性、可靠性和泛化性影响的分析明显缺乏。此外,虽然一些研究提出了标准化的影像组学流程,但它们往往未能评估结果的差异以及每个方法决策的影响。
本研究的目的是评估影像组学流程不同阶段的各种技术决策对基于ML的算法性能的影响,以开发用于预测直肠癌(RC)治疗反应的影像组学生物标志物作为案例研究。RC是全球男性和女性中第三大癌症相关死亡原因。目前的治疗计划包括新辅助放化疗(nCRT);然而,75-85%的部分反应或肿瘤进展的患者可能接受不必要的治疗, associated with high toxicities。不幸的是,目前没有可用的生物标志物来预测个体RC患者的反应。
因此,我们的研究旨在为开发基于MRI的影像组学特征以预测RC的治疗反应提出标准指南,评估多种技术决策对模型准确性的影响。我们相信,通过为影像组学应用提供建议和见解,定义共同认可的指南至关重要,以促进此类系统转化为临床实践。
本研究涉及的步骤包括预处理方法以减少固有图像变异性、自动分割算法、特征提取和归一化的技术决策,以及用于预测系统开发的不同特征选择和机器学习(ML)方法的影响。最后,在外部验证集上评估性能。
本研究回顾性收集了来自六个不同意大利机构的病理证实RC患者的多参数MRI,时间从2000年11月至2019年9月。纳入标准包括:活检证实RC;nCRT前进行的MRI检查,至少包括轴向T2加权(T2w)序列和表观扩散系数(ADC)图;治疗反应的评估。这项多中心回顾性研究获得了每个机构的机构审查委员会(IRBs)的批准,由于使用去标识化数据,放弃了签署知情同意的要求。
对于预测系统的开发,参考标准是病理肿瘤回归分级(pTRG)或对治疗的临床反应。pTRG由经验丰富的病理学家评估,使用Mandard分类。考虑了三个不同的临床目标:预测完全反应者(cR)、预测良好反应者(gR)和预测不良反应者(bR)。
数据集按MRI供应商划分,以应对供应商无关策略的挑战。构建集包括来自Philips和Siemens扫描仪的序列,而外部测试集(ExtTEST)仅包括GE检查。构建集进一步分为训练集(TR)和内部验证集(IntVAL)。TR仅包含使用Philips扫描仪获取的检查,用于算法训练。IntVAL包括所有Siemens检查和一个中心的Philips检查,用于选择每个临床目标中性能最佳的模型。
数据集中的图像在空间分辨率和信号强度方面表现出高度变异性,这高度依赖于扫描仪和采集参数。为了减少噪声、变异性和图像异质性的影响,定义了一个预处理步骤,包括空间和强度归一化方法。首先,将所有图像重采样以匹配构建集中发现的最高平面内分辨率。然后,将它们裁剪到同一集合中所有供应商和中心的最小视野(FOV)。结果,所有图像具有标准化的FOV为18 cm,平面内分辨率为0.47 × 0.47 mm。最后,为了标准化图像强度,应用了z-score归一化,这比其他方法(如min-max、p1p99或无归一化)更有效地减少了多中心MRI数据集的整体变异性在直方图形状、强度范围和特征分布差异方面。
为了实现直肠癌检测和预后的全自动化系统,本研究依赖自动分割掩码而不是手动注释。这些掩码使用已开发和验证的全卷积网络(如U-Net)获得,该网络以专家放射科医生提供的手动分割掩码作为地面实况进行训练。这个多中心和
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号