基于增强CT影像组学与炎症指标的感染性胰腺坏死早期预测诺莫图构建与验证

【字体: 时间:2025年10月04日 来源:Journal of Inflammation Research 4.1

编辑推荐:

  本研究创新性地整合增强CT(CECT)影像组学特征与临床炎症指标,构建并验证了预测急性坏死性胰腺炎(ANP)患者继发感染性胰腺坏死(IPN)的诺莫图模型。该模型通过机器学习算法(LightGBM)筛选关键影像特征,联合APACHE II、MCTSI评分等临床参数,展现出卓越的 discriminative 能力(训练集AUC=0.877,测试集AUC=0.829),为IPN的早期无创量化评估提供了重要工具。

  
研究背景与意义
急性胰腺炎(AP)是全球常见的胃肠道急症,其发病率逐年上升。其中10%-20%的患者会发展为急性坏死性胰腺炎(ANP),而约33%的ANP患者会进一步进展为感染性胰腺坏死(IPN)。IPN是一种严重的局部并发症,会增加感染扩散和胰瘘形成的风险,并可能导致代谢紊乱、全身炎症反应综合征(SIRS)和多器官功能障碍综合征(MODS)等全身性并发症,死亡率高达13%-35%。IPN的早期诊断面临巨大挑战。增强CT(CECT)中胰腺或胰周积液内出现气泡是诊断IPN的重要指标,但疾病初期常规手动评估的敏感性有限(约25%-56%)。细针穿刺(FNA)后革兰氏染色和培养因假阴性率高(20%-50%)和可能引起感染的风险而不作为首选。降钙素原(PCT)、C反应蛋白(CRP)和动脉乳酸水平被认为是相对精确且易于获取的生物标志物,但这些指标在其他感染部位也会升高,并在疾病初期因SIRS和MODS而升高。影像组学(Radiomics)是一种从影像数据中提取大量信息的强大方法,有助于发现图像特征与疾病状态之间难以被放射科医生察觉的细微关系。诺莫图(Nomogram)进一步将多个变量整合成直观的图形计算器,提供个体化的结果概率估计。虽然已有一些影像组学研究用于预测AP的严重程度、复发和胰外坏死,但专门针对IPN预测的研究较少。因此,本研究旨在结合临床炎症指标和CECT影像组学信息,建立一种用于早期、准确预测ANP患者发生IPN的诺莫图。
材料与方法
本研究是一项回顾性单中心研究,遵循《赫尔辛基宣言》原则,经西安交通大学第一附属医院机构审查委员会批准,免除了书面知情同意。筛选2022年5月至2024年12月期间诊断为ANP的患者。ANP的诊断基于修订版亚特兰大分类(RAC),包括胰腺实质坏死(PPN)和/或胰外坏死(EXPN)。在CECT上,胰腺坏死表现为胰腺实质强化减弱或缺失;胰外坏死包括胰周和邻近腹膜后脂肪坏死,表现为脂肪浸润以及液体和/或固体积聚。纳入标准为:(1)年龄>18岁;(2)首次发作;(3)症状出现后7天内进行腹部CECT检查。排除标准包括:(1)既往存在慢性胰腺炎、胰腺手术史、肝硬化、恶性肿瘤或其他可能导致腹腔积液的疾病;(2)入院时存在感染性疾病;(3)存在胃肠道瘘;(4)图像质量不佳;(5)关键临床数据不完整。IPN的确诊依据为:(1)CECT检测到胰腺和/或胰周组织内有腔外气体,或(2)在CT/超声引导下FNA或首次侵入性治疗干预期间获取的样本培养阳性。收集的基线临床数据包括年龄、性别、病因、严重程度、实验室检查结果、急性生理与慢性健康评估(APACHE II)评分、急性胰腺炎严重程度床边指数(BISAP)评分和改良CT严重指数(MCTSI)评分。一位有八年临床经验的消化内科医生在入院48小时内计算每位患者的APACHE II和BISAP评分。本研究共纳入203例患者,其中79例诊断为IPN,124例为非IPN(Non-IPN)。这些患者按7:3的比例随机分为训练集(142例)和内部测试集(61例)。
所有受试者均使用256排CT扫描仪(Philips iCT 256或Revolution CT; GE Healthcare)进行腹部CECT检查。通过图像存档与通信系统(PACS)回顾性评估和收集CT图像。选择门静脉期图像进行分析以增强坏死识别。感兴趣区域(ROI)包括整个胰腺(包括胰腺坏死,排除血管、胆管和饲管)和胰周液体积聚。目标区域由两位均有超过十年腹部CT诊断经验的放射科医生(A和B)手动勾画。分割过程中实行匿名化,读者不知晓临床数据。使用开源ITK-SNAP软件(3.8.0版)逐层分割三维ROI。通过协商达成一致以确保每个ROI标注的准确性。
使用PyRadiomics(3.1.0版)进行图像预处理和特征提取。分析包含两种类型的图像:原始图像和滤波后图像。采用了七种滤波技术:指数、梯度、高斯拉普拉斯(Laplacian of Gaussian)、局部二值模式-三维(lbp-3D)、对数、平方和平方根。提取的特征分为三类:(i)14个形态学特征,(ii)18个一阶特征,(iii)73个纹理特征。共提取了924个特征。
对于特征降维和选择,采用Student‘s t检验或Mann–Whitney U检验来识别Non-IPN组和IPN组之间具有显著差异的影像组学特征。使用z-score归一化对特征分布进行标准化。为减少潜在共线性,应用Pearson相关性分析(阈值为0.9),当两个特征之间的绝对相关系数超过0.9时,保留P值较低的特征。采用LASSO回归模型(基于5折交叉验证的最小准则)进一步筛选剩余的影像组学特征。为提升性能和鲁棒性,使用了三种机器学习分类器——支持向量机(SVM)、K近邻(KNN)和LightGBM来构建影像组学标签(Rad score)。最终使用性能最佳的分类器和关键影像组学特征计算Rad score。通过单变量回归分析识别显著的临床因素,并将其纳入多变量逻辑回归分析来建立临床标签。使用AIC防止过拟合并选择最合适的模型。通过多变量逻辑回归分析结合Rad score和临床标签来建立组合模型。使用受试者工作特征(ROC)曲线和DeLong检验评估和比较模型的区分能力。计算了多种性能指标,包括曲线下面积(AUC)、敏感性、特异性、阳性预测值(PPV)、阴性预测值(NPV)和F1分数。使用校准曲线和Hosmer-Lemeshow检验评估校准效能。应用决策曲线分析(DCA)评估临床实用性。
定量变量以均值±标准差(SD)或中位数(四分位距)描述,分类变量以数字(百分比)表示。分别使用Shapiro–Wilk检验和Levene’s检验评估连续变量的正态性和方差齐性。连续变量的比较采用Student‘s t检验或Mann–Whitney U检验,分类变量的率比较采用卡方检验或Fisher精确检验(视情况而定)。使用R统计软件(3.4.2版)进行统计分析。采用DeLong检验比较ROC曲线。应用Hosmer-Lemeshow拟合优度检验评估校准能力(P > 0.05表示模型校准良好)。统计学显著性设定为双尾P < 0.05。
研究结果
本研究共纳入203例ANP患者,包括128名男性和75名女性,年龄47.0±14.2岁(范围18-77岁)。其中79例为IPN,124例为Non-IPN。训练集(n = 142)中,男性97例,女性45例,年龄46.0±13.6岁(范围18-72岁),包括56例IPN和86例Non-IPN。测试集(n = 61)中,男性31例,女性30例,年龄49.2±15.4岁(范围18-77岁),其中23例为IPN,38例为Non-IPN。两组患者的基线临床特征具有可比性。
在总共924个影像组学特征中,196个因可靠性差被剔除,剩下728个用于进一步分析。统计检验确定了416个与结局显著相关的特征。通过Pearson相关性分析(绝对相关系数≤0.9),保留了120个特征。然后使用LASSO算法对剩余特征进行进一步降维。最终筛选出7个影像组学特征,使用SVM、KNN和LightGBM算法为每位患者计算Rad score。基于LightGBM分类器的Rad score在区分IPN和Non-IPN方面表现出最佳性能。在训练集中,其AUC为0.862(95% CI: 0.788–0.937),准确度为0.893,敏感性为0.875,特异性为0.925。在测试集中,AUC为0.828(95% CI: 0.692–0.964),准确度、敏感性和特异性分别为0.789、0.800和0.769。
多变量逻辑回归分析显示,APACHE II评分(OR = 1.43, 95% CI: 1.02–2.02, P = 0.039)、MCTSI评分(OR = 1.87, 95% CI: 1.05–3.31, P = 0.032)和Rad score(OR = 3.40, 95% CI: 5.62–10.45, P < 0.001)是预测IPN的独立预测因子。随后利用逻辑回归结合APACHE II、MCTSI和Rad score开发了诺莫图。该诺莫图显示出良好的区分能力,在训练集和测试集中的AUC分别为0.877(95% CI: 0.794–0.960)和0.829(95% CI: 0.687–0.972)。在训练集中,其准确度、敏感性、特异性分别为0.840、0.781和0.986。在测试集中,其准确度、敏感性、特异性分别为0.820、0.800和0.857。校准曲线显示在训练集和测试集中均具有良好的校准度(P > 0.05)。决策曲线表明,如果阈值概率在20–90%之间,应用该诺莫图预测IPN比“全部治疗”和“全部不治疗”策略能提供更高的临床净获益。在此范围内,该诺莫图比单独的临床模型和影像组学模型具有更好的预测效果。
模型性能比较表明,组合模型的区分性能总体上优于单一的临床模型和单一的影像组学模型。影像组学模型在训练集(临床 vs 影像组学,0.771 vs 0.862, P = 0.089)和测试集(临床 vs 影像组学,0.757 vs 0.828, P = 0.439)中略优于临床模型。此外,诺莫图和影像组学模型在训练集(影像组学 vs 诺莫图,0.862 vs 0.877, P = 0.610)和测试集(影像组学 vs 诺莫图,0.828 vs 0.829, P = 0.965)中表现出相当的性能。值得注意的是,诺莫图在训练集中显著优于临床模型(临床 vs 诺莫图,0.771 vs 0.877, P = 0.049),而在测试集中的性能相当(临床 vs 诺莫图,0.757 vs 0.829, P = 0.284)。
讨论
本研究建立并验证了临床模型、影像组学模型以及临床-影像组学组合诺莫图,用于早期预测ANP患者的IPN。影像组学模型略优于临床模型。组合诺莫图表现出最佳的预测性能,在训练集和测试集中的AUC分别达到0.877和0.829。决策曲线分析证实了该模型的临床实用性和决策净获益。这些发现表明,临床-影像组学组合诺莫图为IPN的早期预测提供了更准确、客观的方法。
传统的CT评分系统,如CTSI和MCTSI,以及坏死积液内气体征象,对感染的预测价值有限。影像组学分析从放射图像中提取综合数据,为临床医生提供更精确、可量化的信息以支持诊断和治疗决策。本研究手动分割了胰腺和胰周坏死及液体积聚,以更好地表征病变的局部特征。此外,采用了三种机器学习分类器(SVM、KNN和LightGBM)来增强影像组学标签的性能和鲁棒性。正如预期,影像组学模型在预测IPN方面,在训练集和测试集均达到了最佳的准确度、敏感性和特异性。
本研究确定了有助于早期预测IPN的关键临床因素。APACHE II评分和MCTSI评分被发现是预测ANP患者发生IPN的独立风险因素,这与既往研究结果一致。APACHE II评分系统在预测胰腺坏死方面具有高敏感性(93.33%)和显著的阴性预测值(96.15%)。本研究进一步证实了APACHE II评分系统对IPN的预测能力。较高的MCTSI评分与更广泛的胰腺坏死程度呈正相关,也表明更严重的胰腺及胰周炎症、更明显的局部液体积聚和流动性降低,共同为病原体定植创造了有利环境。另一方面,高炎症性和富含酶的坏死液体会加剧坏死过程并损伤周围肠粘膜和血管壁,从而增加肠道细菌移位、继发感染和出血的风险。
本研究探讨了将源自胰腺和胰周病变的影像组学信息与临床炎症指标相结合,开发用于预测IPN的组合诺莫图。所建立的诺莫图可作为预测IPN的可靠无创工具,并有效指导ANP患者的干预决策。
本研究存在一定的局限性。首先,这是一项在单一三级转诊中心进行的回顾性研究,可能引入选择偏倚并限制预测的普适性。需要进行涉及多中心和更大样本量的额外研究来证实我们的结果,这将是我们未来工作的重点。其次,本研究纳入了通过CECT上的腔外气体和/或FNA或侵入性治疗干预的组织微生物培养证实的IPN患者,但腔外气体仅存在于约一半的IPN患者中,且FNA的假阴性率为12-25%,这引入了选择偏倚。第三,由于AP是一种通常边界不清的炎症性疾病,ROI是手动进行3D勾画的。手动勾画容易受到个人经验、窗宽窗位设置以及主观判断差异的影响,导致ROI存在差异,并降低特征的可重复性。在未来的研究中,我们的下一步将是实施基于人工智能的自动或半自动分割技术,并将模型集成到临床工作流程中——这两者对于提高效率和临床适用性都至关重要。尽管如此,由两位资深放射科医生进行评估以及设定ICC值≥0.75的纳入阈值,在一定程度上减轻了我们研究中因分割变异性带来的偏倚。在未来的工作中,我们将使用Dice系数(采用≥0.85的阈值)进一步量化分割一致性,以系统提高观察者间可重复性。
结论
总之,通过整合CECT图像的影像组学信息与临床数据,我们开发了一种用于早期预测ANP患者发生IPN的影像组学诺莫图。该组合模型在预测ANP患者IPN方面可能具有重要的临床价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号