基于CT影像组学与临床特征的机器学习模型预测COVID-19后肺纤维化风险

【字体: 时间:2025年07月04日 来源:Respiratory Research 4.7

编辑推荐:

  为解决COVID-19后肺纤维化(PCPF)早期预测难题,上海交通大学医学院附属瑞金医院团队整合定量CT(qCT)影像组学与临床数据,通过LASSO回归筛选10个关键特征(含2个新型qCT标志物),构建支持向量机(SVM)预测模型。该模型在训练/验证队列中AUC达0.836/0.797,为临床风险分层提供量化工具,发表于《Respiratory Research》。

  

背景与挑战
当全球仍在应对COVID-19急性感染时,越来越多的康复者面临长期后遗症困扰,其中肺纤维化(Pulmonary Fibrosis, PF)成为最棘手的并发症之一。约三分之一的COVID-19幸存者在6个月随访中出现肺部纤维化改变,这种被称为COVID-19后肺纤维化(Post-COVID-19 Pulmonary Fibrosis, PCPF)的病症不仅导致呼吸困难、运动耐力下降,还与死亡率升高密切相关。然而,临床缺乏可靠的早期预测工具,传统CT评估依赖主观视觉判断,难以量化风险。

破局之道
上海交通大学医学院附属瑞金医院领衔的多中心团队提出创新解决方案:将人工智能驱动的定量CT(quantitative CT, qCT)分析与临床指标结合,通过机器学习构建预测模型。研究人员认为,影像组学(Radiomics)能从海量CT数据中提取人眼无法识别的纹理特征,而机器学习算法擅长挖掘这些高维数据的潜在规律,二者结合有望突破现有诊断瓶颈。

关键技术方法
研究纳入204例COVID-19肺炎患者(来自上海三家医院),采用AVIEW软件自动分割全肺并提取29个影像组学特征,结合49项临床指标形成78维数据集。通过LASSO回归筛选出10个关键预测因子(含年龄、中性粒细胞计数、全肺网状改变百分比等),最终在12种机器学习算法中确定支持向量机(Support Vector Machine, SVM)为最优模型,并在内部验证(n=19)和外部验证(n=111)队列中验证性能。

研究结果

患者特征揭示风险因素

  • PF患者年龄显著更大(74.8±9.77 vs 67.1±15.2岁,p=0.004),重症比例更高(72.5% vs 39.6%)
  • 实验室指标显示PF组中性粒细胞绝对值(5.82×109/L vs 4.71×109/L)、CK-MB(1.7 vs 1.2 ng/mL)显著升高
  • 抗凝(90% vs 67.9%)和抗纤维化药物(40% vs 13.2%)使用率差异显著

影像组学标志物脱颖而出
LASSO回归筛选出两个关键qCT特征:

  1. 全肺网状改变百分比(whole lung_reticulation(%) ILD texture analysis)
  2. 肺区≥5%间质性肺异常区域数(ILA_Num of lung zones≥5%_whole lung_ILA)

模型性能验证
SVM模型展现出稳定判别力:

  • 训练队列AUC 0.836(95%CI:0.830-0.842)
  • 外部验证队列AUC 0.797(95%CI:0.691-0.873)

结论与展望
该研究首次证实整合qCT影像组学与临床参数的机器学习模型可有效预测PCPF风险,其核心价值在于:

  1. 发现全肺网状改变百分比这一新型影像标志物
  2. 建立可解释的10因子预测体系,涵盖临床易获取指标
  3. 通过多中心验证确保模型泛化能力

局限性包括回顾性设计和小样本量,未来需通过前瞻性队列验证。团队建议将模型输出概率值与临床决策结合,例如对高风险患者早期启动肺康复或抗纤维化干预。这项发表于《Respiratory Research》的研究为COVID-19长期管理提供了重要工具,也为其他病毒性肺炎后肺纤维化研究提供了范式参考。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号