深度学习新突破:DeepSpiro 从肺功能图时间序列精准检测与早期预测慢性阻塞性肺疾病

【字体: 时间:2025年02月16日 来源:npj Systems Biology and Applications 3.5

编辑推荐:

  为解决 COPD 检测和早期预测难题,天津理工大学的研究人员开展 DeepSpiro 模型相关研究。结果显示该模型检测和预测性能良好。此研究能助力临床决策,值得科研读者一读,为 COPD 研究开拓新思路。

  
天津理工大学(Tianjin University of Technology)的研究人员 Shuhao Mei 等人在npj Systems Biology and Applications期刊上发表了名为 “Deep learning for detecting and early predicting chronic obstructive pulmonary disease from spirogram time series” 的论文。该论文在慢性阻塞性肺疾病(Chronic Obstructive Pulmonary Disease,COPD)的检测和早期预测领域具有重要意义,为改善 COPD 患者的诊疗现状提供了新的思路和方法。

研究背景


COPD 是一种慢性肺部疾病,以气流受限为特征,会导致患者呼吸困难、活动受限和生活质量下降,随着病情进展,还可能增加心血管疾病风险,甚至导致过早死亡。因此,及时准确地检测 COPD 对降低患者健康风险至关重要。临床诊断 COPD 通常依据第一秒用力呼气容积与用力肺活量的比值(FEV1/FVC)是否低于 70% ,但该方法在不同年龄段人群中的准确性存在差异,可能导致部分患者无法及时得到正确诊断和个性化治疗。

近年来,深度学习技术被用于分析 COPD 的特征,但现有方法仍存在诸多挑战。在生成用于判断气流受限程度的容积 - 流量(Volume-Flow)曲线时,当前技术可能产生不稳定的曲线,影响模型预测准确性;容积 - 流量曲线长度因个体呼气时长不同而各异,现有处理方法(填充缺失值或下采样截断)可能引入噪声或丢失重要数据;现有的深度学习模型大多是黑箱模型,缺乏可解释性,难以获得医疗专业人员和患者的信任;而且现有方法只能基于明显特征检测已患 COPD 的患者,无法依据肺功能图(spirogram)变化早期预测个体未来患 COPD 的风险。基于这些问题,开展此项研究具有重要的现实意义。

关键技术方法


研究团队提出了一种基于深度学习的方法 DeepSpiro,用于早期预测未来 COPD 风险,它主要包含四个关键组件:

  • SpiroSmoother:通过时间 - 容积不稳定性平滑来构建容积 - 流量曲线。利用高斯滤波对原始时间 - 容积曲线进行平滑处理,增强曲线稳定性,同时保留关键生理信号,再通过有限差分法和线性插值将平滑后的曲线转换为稳定的容积 - 流量曲线。
  • SpiroEncoder:从不同长度关键补丁的变异性模式中提取关键特征。采用自适应时间分解方法,动态计算每个时间序列补丁最合适的 “关键补丁” 数量,通过 Net1D 网络提取空间和时间特征,对关键特征进行编码和掩码处理,构建关键补丁特征张量,有效避免填充零信息带来的噪声,最终通过双向长短期记忆网络(Bi-LSTM)获取关键补丁之间的变异性模式关系。
  • SpiroExplainer:基于容积注意力和异质特征融合来解释模型。通过动态容积注意力整合方法,突出对模型预测至关重要的时间补丁。将数据经过一系列线性变换、激活函数处理和双线性变换后计算注意力分数,再通过 softmax 函数得到容积注意力权重。同时结合人口统计学信息,利用梯度提升框架(Catboost)处理融合特征,提高 COPD 风险评估的准确性,并提供模型决策的解释。
  • SpiroPredictor:基于关键补丁凹度的变异性模式预测 COPD 风险。定义基于有向面积的凹度度量来表征容积 - 流量曲线的凹度,通过计算曲线与基线之间的有向面积来衡量凹度程度。将 SpiroExplainer 模块输出的 COPD 风险与容积 - 流量曲线的关键凹度信息融合,输入到未来疾病风险预测器(如 Catboost、Xgboost、随机森林等分类器)中,预测未确诊高风险患者未来 1 - 5 年及更长期的患病概率。

研究结果


  1. 模型检测和预测性能:研究人员将 DeepSpiro 与 ResNet18 基线模型进行比较,在英国生物银行(UK Biobank)数据集上进行训练和评估,使用受试者工作特征曲线下面积(AUROC)、精确率 - 召回率曲线下面积(AUPRC)和 F1 分数等指标。结果显示,在 COPD 检测任务中,DeepSpiro 的 AUROC 达到 83.28%,AUPRC 为 35.70%,F1 分数为 39.50%,均优于基线模型。同时,DeepSpiro 在参数数量和浮点运算方面也表现更优,且利用人口统计学信息和 FEV1/FVC 诊断金标准能进一步提高模型诊断准确性。
  2. 未来风险预测分析:研究人员将曲线分为早期曲线(PEF~FEF25 和 FEF25~FEF50)和晚期曲线(FEF50–FEF75 和 FEF75+)。通过观察发现,疾病风险降低时,早期曲线的凹度减小,晚期曲线的凹度增大;高风险个体早期曲线更易塌陷,低风险个体晚期曲线更易塌陷。设计的凹度趋势测量模型表明,凹度趋势值越大,曲线塌陷越早发生。对高风险和低风险人群未来疾病风险的预测显示,高风险组疾病风险随时间呈指数增长,低风险组风险基本保持在零附近。随着发病时间推进,患者容积 - 流量曲线的凹度逐年减小,表明疾病对肺功能的影响在后期更显著。
  3. 亚组分析结果:对不同年龄组、性别和吸烟状况进行亚组分析。在吸烟者亚组中,COPD 患者患病率高于非吸烟者,DeepSpiro 对吸烟者的预测概率和范围均高于非吸烟者,且模型在两组间具有较强的判别能力;在性别亚组中,男性 COPD 发病率高于女性,模型对男性的预测概率和范围更大,同样具有强判别能力;在年龄亚组中,COPD 高发年龄在 45 - 80 岁,DeepSpiro 对该年龄段内吸烟者的预测概率更高,预测范围更大,且在不同亚组中,DeepSpiro 的 AUROC 均最高,体现了其在不同亚组中的适用性。此外,随着发病时间推进,吸烟者、男性和老年患者的肺功能凹度测量值更高,与临床观察一致。
  4. SHAP 分析结果:SHAP 分析揭示了特征的相对重要性,吸烟、男性和年龄较大对模型判断 COPD 风险影响较大,DeepSpiro 的预测结果与相关研究结论相符,即吸烟者、男性和老年患者被预测患 COPD 的风险更高。
  5. 模型解释器分析:SpiroExplainer 能自动聚焦于容积 - 流量数据的病变区域,对于非 COPD 患者,模型聚焦于 FEF25 - FEF50 和 FEF75 附近区域,符合非 COPD 患者特征;对于 COPD 患者,模型聚焦于 FEF75 附近区域,与 COPD 患者特征一致。但在分析模型错误预测案例时发现,哮喘患者因吸入不足、COPD 患者因呼气不均匀或中途吸气等情况,会导致模型预测准确性降低,但模型的预测在医学上具有可解释性。

研究结论与讨论


DeepSpiro 模型具有两大主要功能:一是能够高效检测 COPD,在 AUC 等性能指标上超越当前一些先进模型;二是首次利用关键补丁凹度信息预测未来 1 - 5 年患 COPD 的风险,实验结果表明该方法在预测未来 COPD 风险方面具有较高准确性。该模型为 COPD 的检测和早期风险预测提供了更准确的手段,有助于改善临床决策和患者预后,有望成为有价值的早期筛查工具,从而延缓疾病进展,降低患者死亡率。

然而,该研究也存在一定局限性。DeepSpiro 在英国生物银行数据集上表现良好,但在其他人群中的通用性尚不确定,不同人群的肺功能图特征差异可能影响模型性能;在实际临床环境中的进一步验证至关重要,从研究到临床应用可能面临数据质量变化、噪声增加和临床工作流程差异等挑战,需要对模型进行更多调整和优化;虽然模型在大多数预测区间的 AUROC 值较高,但 AUPRC 表现欠佳,尤其是在预测 1 - 2 年内 COPD 发病时,这主要归因于数据集的类别不平衡问题。不过,对于某些较长时间的预测窗口(如超过 5 年),模型的 AUPRC 值具有可比性或优越性,表明结合容积 - 流量曲线的凹度特征和人口统计学信息有助于在较长时间范围内捕捉关键特征。从临床角度看,早期 COPD 检测的重要性往往高于假阳性风险,被标记为高风险的个体可进一步进行胸部成像等确认评估,且模型在不同预测窗口的稳健 AUROC 性能表明其具有较强的判别能力,使其仍不失为一种有价值的早期筛查工具。

未来,研究团队将致力于使用来自不同地理位置和人口背景的数据集训练和验证模型,评估人口统计学和环境因素对模型性能的影响,提高模型通用性;开发用户友好的软件工具,方便医生在临床环境中应用该模型获取可靠且易懂的结果,辅助诊断和治疗患者;通过纳入更多高质量数据集,进一步提高模型在更广泛场景中的预测有效性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号