编辑推荐:
在基于影像组学的生存建模中,选取合适 ROI 至关重要。研究人员针对区域播散性疾病中多病灶整合问题,探索将多病灶影像组学数据纳入生存模型的策略。结果显示,纳入所有病灶可提升模型 c-index,表明多病灶信息对增强预测能力有重要价值。
在医学影像分析领域,如何从复杂的影像数据中精准挖掘预后信息一直是研究热点。传统的影像组学研究多聚焦于单一感兴趣区域(ROI),如原发肿瘤,然而对于区域播散性疾病,患者往往存在多个独立病灶(如原发灶、转移灶及受累淋巴结),这些病灶的异质性可能蕴含丰富的预后信息。但现有研究中,针对病灶数量在患者间不一致的多 ROI 整合问题鲜少涉及,如何将这些结构上异质的多病灶数据有效纳入生存模型成为亟待解决的难题。
为填补这一研究空白,来自波兰 Maria Sklodowska-Curie 国家肿瘤研究所在格利维采的分支机构的研究人员开展了相关研究。他们以非小细胞肺癌(NSCLC)患者为研究对象,旨在评估将多病灶影像组学数据整合到生存模型中的可行性,探索有效的 ROI 聚合策略,并验证纳入所有病灶是否能提升模型性能。该研究成果发表在《Computer Methods and Programs in Biomedicine》。
研究人员回顾性收集了 115 例波兰 NSCLC 患者的临床数据,其中 60% 为局部晚期患者,存在多个 ROI(病灶数量 1-10 个)。研究采用两种特征集:从 PET 提取的影像组学特征,以及将 PET 插值至 CT 分辨率后提取的特征(PET_CT)。通过蒙特卡洛交叉验证框架,在多种生存模型中测试了两种聚合策略:一是聚合特征向量形成代表性向量,二是聚合建模结果计算综合风险评分。研究以 Harrell’s c-Index 评估模型预测能力,该指标是生存分析中相当于分类问题 ROC 曲线下面积(AUC)的指标,值为 0.5 表示随机预测,1 表示完美预测。
结果
模型性能对比
通过对比仅使用原发肿瘤(primary tumour)和纳入所有病灶的模型性能发现,无论采用哪种特征集和生存模型,纳入所有病灶均一致提升 c-Index。仅用原发肿瘤时,PET 数据集最高 c-Index 为 0.611,PET_CT 数据集为 0.614;而纳入所有病灶后,c-Index 分别提升至 0.632 和 0.634。
多病灶信息的价值
结果表明,除原发肿瘤外的其他病灶携带可用于提升模型预测能力的信息,验证了研究假设,即整合多病灶数据能更全面捕捉疾病特征,优于单一原发灶分析。
结论与讨论
本研究首次系统验证了在影像组学生存模型中整合多病灶数据的有效性。聚合策略为处理结构异质性多 ROI 提供了可靠解决方案,不仅适用于影像研究,也为分子研究中多维度数据整合提供了新思路。研究结果强调,在区域播散性疾病的预后评估中,需重视原发灶以外的病灶信息,这对优化肺癌等晚期癌症的风险分层和治疗决策具有重要临床意义。未来可进一步拓展至其他癌种及更多元化的影像模态,深入探索多病灶异质性与临床结局的关联机制。
研究中使用的关键技术方法包括:从医学影像中提取影像组学特征(涉及 PET 和 CT 模态)、特征向量聚合与风险评分聚合策略、蒙特卡洛交叉验证(用于模型评估),以及 Harrell’s c-Index 统计分析。样本队列来自波兰 Maria Sklodowska-Curie 国家肿瘤研究所在格利维采的分支机构的 115 例 NSCLC 患者,其中近 60% 存在多个 ROI。