编辑推荐:
这篇综述聚焦透明细胞肾细胞癌(ccRCC),通过瘤内和瘤周区域的 CT 影像组学分析,构建多种模型预测 WHO/ISUP 分级。结果显示综合模型预测能力强,有助于精准评估病情、制定治疗策略,为 ccRCC 诊疗提供新方向。
研究背景
肾细胞癌(RCC)中,透明细胞肾细胞癌(ccRCC)是主要的组织学亚型,占比达 70 - 90%。ccRCC 转移倾向高、预后较差,其治疗方式多样,而组织病理学分级是关键的独立预后指标。世界卫生组织 / 国际泌尿病理学会(WHO/ISUP)分级系统将肿瘤分为四个等级,等级越高临床结局越差。但传统病理分级依赖手术标本,术前评估常用的穿刺活检存在侵袭性和采样误差等问题。因此,寻找无创的术前评估 WHO/ISUP 分级的方法至关重要。
计算机断层扫描(CT)是常用的肾癌术前筛查手段,但单纯 CT 无法预测病理分级。影像组学可从医学图像中提取特征分析肿瘤异质性,在 ccRCC 诊断和分级中逐渐展现优势。然而,传统影像组学将肿瘤视为单一整体,忽略了瘤内区域表型差异。瘤内异质性源于肿瘤发展过程中细胞分裂增殖导致的分子生物学或基因变化,ccRCC 的高异质性包含坏死、囊性变和出血等不同成分,影响肿瘤行为和预后。
栖息地成像技术可对肿瘤进行亚区域划分,量化组织异质性和肿瘤间相互作用,但该技术在肾癌分级中的应用研究较少,且多基于磁共振成像(MRI),基于 CT 的研究不多。本研究旨在利用多期增强 CT 影像识别具有相似特征的亚区域,评估包含这些亚区域异质性特征的影像组学模型对 ccRCC 患者术前病理分级的预测价值,并构建综合模型提升预测能力。
研究方法
- 患者资料:回顾性收集安徽医科大学第二附属医院 2012 年 8 月至 2023 年 8 月确诊为 ccRCC 患者的 CT 影像和临床信息。研究经伦理委员会批准,因回顾性分析豁免知情同意。纳入标准为病理确诊 ccRCC、术前 CT 检查完整、未接受过手术或其他介入治疗;排除标准包括临床资料不完整、CT 图像无法分析、存在其他器官恶性肿瘤。根据术后病理 WHO/ISUP 结果分组,I - II 级为低级别组,III - IV 级为高级别组。446 例患者分为训练队列(70%)和验证队列(30%),另纳入安徽医科大学第一附属医院 67 例 ccRCC 患者数据作为外部验证集。以手术切除组织的病理诊断为金标准。
- 图像采集:使用西门子 SOMATOM Force、Definition AS40 和飞利浦 Brilliance iCT 进行 CT 扫描。患者仰卧位屏气扫描,范围从剑突至髂前上棘。扫描参数为 120 kV、自适应电流、5 mm 层厚和间隔、512×512 矩阵。扫描流程包括平扫和增强扫描,静脉注射 80 mL 碘克沙醇(300 mgI/mL),注射速率 2.5 mL/s,分别在皮质期(延迟 25 - 30 s)、实质期(60 - 70 s)和分泌期(120 - 150 s)进行扫描。
- 图像分割:两位经验丰富的放射科医生在不知病理结果的情况下,用 ITK - SNAP 软件手动逐层勾勒肿瘤区域获取感兴趣区域(ROI),范围不包括肾周和肾窦脂肪。若有分歧,由一位有 20 年经验的放射科医生解决。
- 数据预处理:采用固定分辨率重采样方法标准化体素间隔,设置窗宽 300、窗位 25,以确保图像间准确对比分析。
- 瘤内异质性分析:研究使用平扫、肾皮质期、肾实质期和排泄期四个成像序列,各序列独立分析,构建瘤周区域用于研究。
- 瘤周区域扩张:利用平台的掩模填充工具包,将原始 ROI 掩模以 1 mm、3 mm 和 5 mm 的间隔径向扩展,评估不同扩张范围对模型预测性能的影响。
- 亚区域生成:通过 CT 图像,用 5×5×5 移动窗口法从每个体素提取熵和能量等局部特征,得到 19 维特征向量。使用 K - means 聚类算法将感兴趣体积(VOI)分为 3 - 10 个离散亚区域,通过 Calinski - Harabasz(CH)评分确定最佳聚类数,以更好地描述肿瘤异质性和结构复杂性。
- 特征提取:手工制作的影像组学特征分为几何(肿瘤形状 / 大小)、强度(体素亮度)和纹理(如灰度共生矩阵 GLCM、灰度游程矩阵 GLRLM 等)三类。使用 pyradiomics 3.0.1 提取特征,通过 K 近邻(KNN)算法处理聚类间隙保证标签一致性,预融合亚区域特征用于更好地预测肿瘤分级。
- 特征选择:用组内相关系数(ICC)评估 ROI 勾画的一致性,保留 ICC > 0.8 的特征。通过皮尔逊相关系数去除高度相关(阈值 0.9)的特征,用最小冗余最大相关(mRMR)方法将特征集减少到 64 个,最后通过最小绝对收缩和选择算子(LASSO)回归得到影像组学特征。通过十折交叉验证确定最优正则化参数 λ,保留最具预测性的特征。
- 模型构建
- 影像组学特征模型:用逻辑回归进行线性建模,结合随机森林、XGBoost 和 LightGBM 等算法处理复杂数据结构,构建风险评估模型。
- 瘤周影像组学特征模型(PeriXmm):结合瘤内和瘤周特征,采用与瘤内影像组学特征相同的筛选和建模算法。
- 瘤内异质性评分模型(ITH Score):聚类算法的无监督特征避免了 ICC 分析,确保模型稳定性,有效评估瘤内异质性。
- 临床特征模型:通过单变量和多变量分析筛选 p 值小于 0.05 的临床特征构建临床预测模型。
- 综合模型:通过单变量和逐步多变量分析,将 p 值小于 0.05 的临床特征与最佳瘤周特征和栖息地特征结合,构建最终综合模型。
- 统计分析:用 Shapiro - Wilk 检验检查临床数据的正态分布。根据数据分布选择 t 检验或 Mann - Whitney U 检验评估连续变量的统计学意义,组间 p 值大于 0.05 表示无显著差异。所有统计分析在 OnekeyAI 平台(Python 3.7.12)上进行,使用 Statsmodels 0.13.2 计算,PyRadiomics 3.0.1 提取影像组学特征,Scikit - learn 1.0.2 实现机器学习算法。
研究结果
- 患者信息:本研究共纳入 513 例 ccRCC 患者,其中低级别组 403 例,高级别组 110 例。
- 临床特征分析:经单变量和多变量分析,性别、年龄和血小板等特征在统计分析中 p 值小于 0.05,差异显著。性别差异影响肿瘤生物学行为和治疗反应,年龄是预后关键因素,高龄预后可能较差,血小板计数变化与肿瘤侵袭性和患者凝血功能相关,后续研究将这些指标作为临床控制因素进一步分析。
- 栖息地生成和特征提取:评估聚类中心(3 - 10)对结果的影响,基于最高 CH 指数确定 3 为最佳聚类数。共提取 1106 个独特影像组学特征,分为形状、一阶和纹理类型。最终 ITH 评分结合 3 个亚区域的特征(共 13272 个特征),影像组学和瘤周特征各有 4424 个特征。
- 特征选择结果:使用 Lasso 方法进行特征选择,通过 LASSO 逻辑回归模型确定 Rad - score 的非零系数,通过十折交叉验证得到均方误差(MSE)。
- ITH 评分模型性能:LightGBM 模型在所有数据集上的曲线下面积(AUC)值最高,训练集为 0.891,验证集为 0.877,测试集为 0.847,表明该算法识别不同类别的能力优秀,在验证集和测试集上的强 AUC 性能意味着其泛化能力稳定,在所有数据集的 AUC 方面优于其他算法,是本分类任务的最佳模型。
- 模型评估
- AUC 值分析:瘤周区域中,Peri1mm 在训练集(AUC = 0.856)、验证集(AUC = 0.836)和测试集(AUC = 0.738)中表现最佳,随着区域扩展到 Peri3mm 和 Peri5mm,AUC 值下降,表明过宽的瘤周范围会降低预测效率。栖息地特征在所有数据集上的 AUC 值均高于影像组学特征,说明详细的亚区域特征描述优于将肿瘤视为单一实体。综合模型(包含栖息地、Peri1mm 和关键临床特征)在大多数情况下比单个模型表现更好。
- 校准曲线和决策曲线分析:校准曲线和决策曲线用于评估模型预测能力。Hosmer - Lemeshow(HL)检验比较预测概率与实际结果,HL 值越低校准性能越好。列线图校准良好,训练集、验证集和测试集的 HL 值分别为 0.920、0.824 和 0.812。决策曲线分析表明综合模型在预测概率方面有显著的净效益优势,突出了模型的准确性和可靠性。
讨论
本研究融合影像组学和栖息地成像方法,结合瘤周区域和临床特征构建预测模型。LightGBM 模型在所有数据集上表现最佳,综合模型在测试集上的 AUC 达到 0.852,相比单个模型有显著提升,能更细致地分析肿瘤不同区域,提高分级和预后评估的准确性,支持更精准的临床策略制定。
近年来,栖息地成像技术受到关注,它基于组织病理学和分子生物学差异划分肿瘤亚区域。分析瘤内异质性亚区域对癌症诊断和预后很重要,通常依赖 CT 和 MRI 等成像技术。该技术在肾癌领域的应用逐渐兴起,但目前研究多集中在预测肾癌转移和患者生存预后,利用 CT 图像结合栖息地成像技术进行肾癌分级的研究较少。本研究重点通过肿瘤栖息地分割方法提高 ccRCC 术前分级预测准确性,提取 CT 图像体素特征,用 K - means 聚类算法确定最佳聚类数,提取亚区域特征,构建多种机器学习模型。结果显示亚区域特征在所有评估数据集中优于传统影像组学特征,证明了研究方法在细化 ccRCC 病理分级预测中的实用性。
本研究构建的基于聚类分析的综合分级模型,结合了肿瘤外周区域特征和显著临床特征。以往研究表明,融合瘤内和瘤周特征的预测模型性能优于单一模型。本研究中,瘤周特征(如 Peri1mm)能有效提高模型预测性能,可能与恶性肿瘤向周围组织浸润生长的模式有关,ccRCC 也具有浸润瘤周区域的特点。研究还发现不同肿瘤的瘤周特征有用性不同,取决于分析目标和肿瘤生物学性质。
本研究存在局限性。外部验证数据集仅来自一家医院,未来计划扩大样本量,增加数据多样性,建立标准化数据收集协议和自动分割方法,减少手动分割干扰。感兴趣区域的勾画依赖医生经验,可能存在主观偏差,深度学习算法自动分割可减轻工作量、提高精度。多种机器学习模型构建的框架复杂,临床应用困难,后续应优先选择更简单、可解释的模型。此外,本研究未纳入分子标记物,未来将作为重点研究方向。
总之,融合栖息地成像和瘤周特征的 ccRCC 影像组学分级预测模型优于传统影像组学方法,亚区域分析有效降低肿瘤异质性影响,实现精准术前肿瘤分级。这有助于临床医生准确评估患者病情、制定个性化治疗策略、改善患者预后。未来将扩大样本量、加强多中心研究,建立动态反馈机制优化模型,并将模型集成到放射学报告系统中辅助诊断决策。