基于多中心18F-FDG PET影像组学与机器学习的淋巴瘤虚拟活检及治疗决策研究
《Physical and Engineering Sciences in Medicine》:1?F-FDG PET radiomics and machine learning for virtual biopsy and treatment decisions in lymphoma: a multicenter study
【字体:
大
中
小
】
时间:2025年11月22日
来源:Physical and Engineering Sciences in Medicine 2
编辑推荐:
本研究针对淋巴瘤传统活检的侵入性、局限性及疾病转化监测难题,开展了一项多中心研究,结合基线18F-FDG PET肿瘤-肝脏比值(TLR)影像组学特征与人口统计学数据,利用机器学习模型(Logistic回归、随机森林、XGBoost)对淋巴瘤亚型(霍奇金淋巴瘤HL vs. 非霍奇金淋巴瘤NHL,高级别NHL vs. 经典霍奇金淋巴瘤CHL等)进行分类,并区分ABVD与R-CHOP治疗方案候选者。结果显示,联合淋巴结外影像组学特征可显著提升高级别NHL分类精度(从0.821至0.962)及治疗分类准确率(R-CHOP准确率从0.783提升至0.839),证实了PET影像组学在淋巴瘤无创诊断和治疗决策中的潜力,为实现“虚拟活检”提供了新策略。
淋巴瘤作为最常见的血液系统恶性肿瘤,占所有癌症的5%,其诊断金标准一直是组织活检。然而,活检作为一种侵入性操作,存在样本不足、主观解读、手术风险以及空间限制等问题。尤其令人困扰的是,淋巴瘤在确诊后的任何时间都可能转化为更具侵袭性的类型,这就需要反复进行活检来确认转化,这无疑增加了患者的痛苦和风险。此外,淋巴瘤是一种全身性疾病,可影响多个淋巴结并扩散至身体不同部位,这给诊断和治疗决策带来了巨大挑战。
在此背景下,18F-氟脱氧葡萄糖正电子发射断层扫描/计算机断层扫描(18F-FDG PET/CT)已成为淋巴瘤初始分期、再分期、疗效评估和随访的广泛应用方法。它能提供三维成像,便于有效监测疾病进展。但遗憾的是,这种模态本身无法直接用于估计淋巴瘤亚型。近年来,影像组学(Radiomics)技术通过从医学图像中提取大量定量特征,结合机器学习(Machine Learning)方法,在区分淋巴瘤与其他恶性肿瘤方面显示出潜力。然而,在区分淋巴瘤不同亚型方面,现有研究存在明显局限:多为单中心研究,缺乏地理和种族多样性,所研究的淋巴瘤亚型范围狭窄,并且一些研究仅关注标准化摄取值(SUVmax)最高的肿瘤,可能导致结果偏差。
为了填补这些空白,由Setareh Hasanabadi、Seyed Mahmud Reza Aghamiri、Habib Zaidi等人领导的研究团队在《Physical and Engineering Sciences in Medicine》上发表了一项开创性的多中心研究。该研究首次探索了结合基线18F-FDG PET肿瘤-肝脏比值(Tumor-to-Liver Ratio, TLR)影像组学与人口统计学数据(如年龄),利用机器学习来分类淋巴瘤亚型,并区分适合ABVD(阿霉素、博来霉素、长春花碱、达卡巴嗪)方案和R-CHOP(利妥昔单抗、环磷酰胺、多柔比星、长春新碱、泼尼松)方案治疗的患者。更重要的是,该研究首次系统性评估了在淋巴瘤这种全身性疾病中,仅凭淋巴结(Nodal)影像组学是否足够,还是需要加入结外(Extranodal)影像组学特征才能获得更好的分类效果。
本研究为一项回顾性多中心研究,纳出来自两个中心(伊朗马西赫·达内什瓦里医院和拉齐医院)的241例经组织病理学证实的淋巴瘤患者。所有患者均接受了基线18F-FDG PET/CT检查。研究人员对PET图像进行预处理(重采样、标准化摄取值SUV映射、离散化)后,由经验丰富的核医学医师使用半自动图谱法对病灶进行勾画,不仅勾画淋巴结病灶,还勾画结外病灶,并从每个患者的肝脏无病灶区域提取特征以计算TLR。最终从3794个勾画病灶中提取了107个影像组学特征(包括14个形状特征和93个SUV图特征),并通过均值、最大值、最小值、中位数等指标将病灶级特征聚合为患者级特征。为消除中心间差异,使用了ComBat进行数据协调。将中心1的数据按80:20比例分为训练集和内部验证集,中心2的数据用作外部测试集。采用SelectKBest结合ANOVA F检验进行特征选择,并使用逻辑回归(LR)、随机森林(RF)和XGBoost(XGB)三种机器学习模型进行训练和超参数调优,最终在外部测试集上评估模型性能,并以曲线下面积(AUC)作为主要评价指标。
研究共纳入241例患者(中心1:159例,中心2:82例),包括125例非霍奇金淋巴瘤(NHL)和116例霍奇金淋巴瘤(HL)。其中,94例为高级别NHL,110例为经典霍奇金淋巴瘤(CHL)。110例B细胞淋巴瘤(包括高级别和低级别)。在治疗方面,110例HL患者接受ABVD方案,90例NHL患者为R-CHOP方案候选者。
年龄分布显示,高级别NHL患者倾向于比CHL和HL患者年龄更大。性别分布显示所有淋巴瘤类型中男性患者比例较高。分期分布显示,NHL和高级别淋巴瘤中晚期病例更多,而CHL的分期分布更为均衡。
研究团队定义了五个分类任务:ABVD候选者 vs. R-CHOP候选者(治疗决策)、高级别NHL vs. HL(诊断区分)、高级别NHL vs. CHL(细化HL区分)、NHL vs. HL(早期诊断分诊)、B细胞 vs. 其他(针对病理报告不明确的情况)。
在外部测试集上,对于最佳模型,加入结外影像组学特征提升了对某些淋巴瘤亚型的分类性能:
- •NHL vs. HL分类:准确率从0.807提升至0.819,NHL的精确度从0.837提升至0.875。
- •高级别NHL vs. CHL分类:高级别NHL的精确度显著提升,从0.821提升至0.962。
- •治疗分类(ABVD vs. R-CHOP):加入结外特征后,R-CHOP分类的准确率从0.783提升至0.839,并且ABVD和R-CHOP的F1分数均有提高。
然而,结外特征对B细胞 vs. 其他分类的性能影响甚微。在人口统计学特征中,只有年龄在特征选择过程中被保留下来,表明年龄与淋巴瘤亚型密切相关(年轻患者多患HL,年长患者多患NHL)。
研究还推导出了用于不同分类任务的Dem-Rad Score(人口统计学-影像组学评分),该评分结合了关键的影像组学特征(如GrayLevelVariance灰度水平方差、SizeZoneNonUniformity尺寸区域不均匀性、Contrast对比度等)和年龄,提供了模型可解释性的见解。例如,在NHL vs. HL的分类中,年龄是重要因素;而在ABVD vs. R-CHOP候选者的分类中,影像组学特征更为关键,这可能反映了肿瘤亚型和患者临床病史(如心脏病史)在肿瘤医生治疗决策中的主导作用。
本研究成功证明了结合基线18F-FDG PET TLR影像组学与人口统计学特征,利用机器学习模型,在分类淋巴瘤亚型和区分ABVD与R-CHOP治疗方案候选者方面的巨大潜力。研究首次在多中心框架下,纳入了具有显著地理和种族多样性的患者群体,并系统评估了结外影像组学特征的作用。
研究的关键发现在于,结外影像组学特征的加入对模型性能的提升因淋巴瘤亚型而异。对于高级别NHL这种具有侵袭性、易发生结外侵犯的亚型,结外特征能显著改善分类性能,因为它们能捕获肿瘤超越淋巴结区域的异质性和空间分布信息。相反,对于典型霍奇金淋巴瘤(CHL)等结外侵犯较少的亚型,结外特征的增益有限甚至可能引入噪声。在治疗决策方面,结外特征显著提升了对ABVD和R-CHOP方案,特别是R-CHOP方案的区分能力,强调了在全身性疾病管理中全面评估疾病负荷的重要性。
这项工作为实现淋巴瘤的“虚拟活检”提供了概念验证,这种非侵入性方法有望减少对重复组织活检的需求,特别是在疾病转化监测和病灶难以穿刺的情况下,从而辅助临床医生进行更个性化的治疗决策。研究所开发的Dem-Rad Score增强了模型的可解释性,有助于未来临床转化。
尽管本研究存在一些局限性(如回顾性设计、病理评估潜在差异、扫描仪和协议差异),但其结果为未来研究指明了方向。未来需要在更大规模、更多样化的患者队列中进行前瞻性验证,并进一步探索最佳的肿瘤选择策略,以巩固这些发现并推动其走向临床实践。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号