编辑推荐:
为解决肿瘤轮廓提取的稳定性和诊断能力问题,第四军医大学(空军军医大学)研究人员开展关于自动分割肿瘤轮廓及下游任务诊断的研究,结果表明 AI 驱动的肿瘤分割方法可辅助临床决策,对放射组学临床应用意义重大。
一、研究背景
在医学影像分析领域,肿瘤的准确诊断对于患者的治疗和预后至关重要。放射组学(Radiomics)作为新兴的研究方向,能从医学图像中自动提取定量特征,用于表征疾病生物学特性,在肿瘤研究中展现出巨大潜力,与肿瘤组织学、患者生存情况、新陈代谢以及临床决策都密切相关。
然而,目前在肿瘤轮廓提取这一关键环节却面临诸多挑战。临床实践中,肿瘤区域的分割大多依靠手动完成,但手动分割受多种因素影响,存在显著的不一致性。肿瘤轮廓生长的异质性、医学成像的低分辨率、病变边缘的体积效应,以及不同标注人员之间的差异,都会导致手动分割结果的不稳定。尤其是对于边界模糊或与周围组织对比度低的肿瘤,手动分割的不一致性更为突出。此外,手动分割耗时费力且主观性强,这些缺点可能会对放射组学分析和建模产生重大影响。
虽然计算机辅助的半自动和全自动分割技术能在一定程度上减轻手动分割的负担和变异性,但以往研究主要聚焦于手动和自动分割方法提取的放射组学特征之间的稳定性,对多种自动分割方法之间的变异性及其诊断能力的研究较少,且难以证明自动分割方法在诊断能力上优于手动分割。因此,寻找更稳定、更准确的肿瘤轮廓提取方法迫在眉睫,这也为本次研究提供了重要的契机。
二、研究概况
为了攻克这些难题,第四军医大学(空军军医大学)的研究人员开展了一项关于自动分割肺肿瘤轮廓及下游任务差异诊断的研究。研究成果对临床决策和放射组学的临床应用具有重要意义,该研究成果发表于BMC Medical Imaging期刊。
在研究过程中,研究人员采用了多种关键技术方法。首先,构建了一个包含 1429 例疑似肺癌患者的队列。利用 2 种基于深度学习的自动方法(RNN、UNET)、2 种基于传统图像处理的自动方法(WFCM、SNAKE)以及 3 位不同年资的放射科医生手动分割的方式,对肺结节进行分割,获取相应的感兴趣区域(ROI)。接着,使用 PyRadiomics 从这些 ROI 中提取 1454 维放射组学特征,并通过一系列统计学方法进行特征选择。最后,运用 5 种传统机器学习方法(逻辑回归 LR、支持向量机 SVM、极端梯度提升 XGBoost、多层感知器 MLP、线性判别 LD),针对肺结节良恶性、肺腺癌浸润情况以及肺结节密度类型这 3 个下游任务进行分类和评估。
三、研究结果
- 研究人群:从 1429 例患者中获取了 1626 个肺结节,并将患者随机分为不同的开发集和验证集,用于后续不同下游任务的研究。
- 分割性能:在 1626 个肺结节中,RNN 的 Dice 值在其他自动分割方法中最高,与初级放射科医生手动分割的 Dice 值相比,差距在 3% 以内,这表明 RNN 的分割结果在形状上与手动分割较为接近。
- 放射组学特征一致性:通过比较 RNN 与其他 6 种分割方法和资深放射科医生(S1)提取的放射组学特征差异,发现 RNN 与 S1 的特征差异最小,在 7 个主要特征类别中的 7 个子组中,特征差异值均小于 0.12。计算组内相关系数(ICC)评估特征一致性,结果显示 RNN 的一致性最佳,其与 S1 在所有 7 类放射组学特征中,高度一致(ICC>0.75)的特征数量占比均超过 80% 。
- 下游任务分类性能
- 良恶性分类:在肺结节良恶性分类任务中,RNN 方法的 AUC 值在 5 种机器学习方法中最高(0.840±0.01),略高于 S1(0.824±0.015),且显著优于其他方法。在特征选择方面,RNN 与 S1 的特征交集比例最高,达到 96.6%。
- 肺结节密度类型分类:在该任务中,RNN 的 kappa 值最高(0.729),在整体宏观性能指标上表现最佳,其敏感性、特异性和 kappa 值均为 7 种方法中最高。
- 浸润性腺癌分类:RNN 在浸润性肺腺癌分类任务中的 AUC 值最高(0.946) ,在整体性能指标上也表现出色,其准确性、精确性、特异性和 kappa 值均为 7 种方法中最高。
四、研究结论与意义
综合上述研究结果,研究人员得出结论:在 4 种自动分割方法中,RNN 分割的肿瘤轮廓最接近资深放射科医生手动勾勒的轮廓,其提取的放射组学特征与 S1 最为相似,且在 3 个下游任务的模型性能分析中,RNN 提取的特征具有最强的诊断鉴别力。这充分表明 AI 驱动的肿瘤分割方法能够为临床决策提供可靠且可重复的结果,凸显了自动化肿瘤轮廓提取在临床实践中的辅助作用,为放射组学在临床的广泛应用提供了重要依据。
然而,该研究也存在一定的局限性。数据仅来自单一机构且集中于肺癌,限制了研究结果对其他癌症或机构的普适性;未充分考虑肿瘤复杂性和图像质量等因素对分割方法性能的影响;缺乏外部验证。但这些不足也为后续研究指明了方向,未来研究可纳入多中心数据、探索多种影响因素,并进行外部验证,进一步完善相关研究。总体而言,这项研究为肿瘤诊断领域开辟了新的道路,有望推动 AI 技术在临床肿瘤诊断中的深入应用,提升医疗诊断的准确性和效率,造福更多患者。