编辑推荐:
为解决医学影像数据的图像生成异质性和类别不平衡问题,研究人员开展了关于协调和过采样方法对多中心不平衡数据集影响的研究。结果表明这些方法可改善非小细胞肺癌(NSCLC)亚型预测,但效果因分类器而异。该研究为相关领域提供了重要参考。
肺癌是全球癌症死亡的主要原因,其中非小细胞肺癌(Non-Small Cell Lung Cancer,NSCLC)约占 82%。腺癌(Adenocarcinoma,ADC)和鳞状细胞癌(Squamous Cell Carcinoma,SCC)是 NSCLC 的主要组织学亚型,准确区分二者对肺癌患者的治疗规划和预后判断至关重要。影像组学作为一种从医学图像中提取高维定量特征并构建预测模型的非侵入性框架,在肺癌研究中广泛应用,但面临着可重复性差、预测不准确和泛化性有限等问题。这主要是由于成像参数的变化、数据分布不均衡以及缺乏多中心验证。不同扫描仪、采集协议和重建设置会导致影像组学特征出现非生物学的系统差异,影响其可重复性和预测性能;数据的类别不平衡问题会使机器学习算法误分类,偏向于预测多数类。因此,研究如何通过协调和过采样方法改善多中心不平衡数据集的影像组学模型性能很有必要。
内蒙古大学和南方医科大学等机构的研究人员开展了此项研究,旨在探究协调和过采样方法对多中心不平衡数据集的影响,并将其应用于基于 PET 的 NSCLC 组织学亚型预测。研究结果表明,应用协调和过采样方法可在一定程度上提高 NSCLC 亚型预测性能,但不同分类器的效果差异较大。该研究为多中心不平衡数据集的影像组学分析提供了重要参考,其成果发表在《EJNMMI Physics》上。
研究人员主要采用了以下关键技术方法:首先,收集了来自 4 个中心的 3 个 NSCLC 数据集,共 323 例患者,包含 ADC 和 SCC 患者。然后,利用 ITK-SNAP 软件手动勾勒感兴趣区域(Region of Interest,ROI),使用 Pyradiomics 软件包提取 1502 个影像组学特征。接着,采用分层随机抽样划分数据集,通过 5 次 5 折交叉验证评估模型性能。同时,评估影像组学特征的稳健性,使用 4 种协调方法和 5 种过采样方法处理数据,构建 4 种机器学习分类器进行预测。
下面介绍具体的研究结果:
- 患者情况:研究共纳入 323 例患者,平均年龄 65.16±9.35 岁,男性 206 例(63.8%),女性 117 例(36.2%);ADC 患者 245 例(75.9%),SCC 患者 78 例(24.1%),二者不平衡比为 3.14:1。
- 影像组学特征稳健性:经评估,56.1%(842 个)的影像组学特征对不同分割和噪声水平稳健,这些特征用于后续分析。分割对小波特征影响较大,噪声主要影响小波特征,其他类特征受噪声影响较小。
- 协调和过采样对预测性能的影响:以中心定义批次进行协调时,许多模型表现最佳。在验证队列中,随机森林(Random Forest,RF)分类器与多数过采样方法结合,ComBat 和 Centering-scaling 协调方法的预测性能最高。与基线(无协调和无过采样)相比,RF 分类器的所有组合在 AUROC 和 G-mean 上均有提升;LDA、LR 和 SVM 分类器部分组合的 AUROC 值高于基线,应用过采样方法后 G-mean 值均增加。在测试队列中,RF、LDA、LR 和 SVM 分类器分别有 14/29(52%)、4/13(31%)、2/6(33%)和 7/23(30%)的组合泛化能力优于基线,其中 ComBat+BSMOTE 组合效果最佳,但与基线相比无统计学差异。
研究结论和讨论部分指出,协调和过采样方法可改善多中心不平衡数据集的 NSCLC 亚型预测性能,但效果因分类器而异。ComBat 协调方法在不同研究中的效果不一致,受多种因素影响。该研究还发现协调可消除成像差异,提高数据一致性,过采样增加类内多样性,提升模型对少数类的预测能力。然而,研究存在局限性,如样本量相对较小,主要集中于特征层面的处理。未来需开展更大规模的前瞻性研究,探索图像层面的方法。总体而言,该研究为影像组学在多中心不平衡数据集的应用提供了重要依据,有助于推动相关技术的发展和临床应用。