基于机器学习算法的肺癌术后运动恐惧症风险预测模型构建与验证:一项可解释性人工智能研究

【字体: 时间:2025年06月04日 来源:Scientific Reports 3.8

编辑推荐:

  本研究针对肺癌术后患者普遍存在的运动恐惧症(kinesiophobia)问题,通过整合人口统计学特征、心理社会因素和疾病相关变量,采用LASSO回归和六种机器学习算法(DT/RF/XGBoost/SVM/ANN/KNN)构建预测模型。结果显示随机森林(RF)模型表现最优(AUROC=0.893),识别出积极应对方式、疼痛程度、社会支持等关键预测因子,为临床早期筛查高风险患者提供了智能化工具,对改善患者术后康复具有重要实践价值。

  

肺癌作为全球癌症相关死亡的首要原因,每年导致约180万人死亡。尽管胸腔镜手术等微创技术显著进步,术后患者仍普遍面临中重度疼痛和运动恐惧症——这种对活动的病理性恐惧会阻碍咳嗽、下床活动等关键康复行为,导致肺功能恢复延迟甚至废用综合征。传统评估方法难以精准识别高风险患者,而机器学习(ML)在多维数据整合和复杂模式识别方面的优势为此提供了新思路。

锦州医科大学附属第一医院护理部张岚团队联合胸外科开展了一项横断面研究,纳入519例辽宁省三甲医院的肺癌术后患者,采用Tampa运动恐惧量表(TSK)评估发现43.74%存在运动恐惧症。研究通过LASSO回归筛选出10个预测变量后,构建六种ML模型比较性能,最终RF模型在测试集展现出最佳判别力(AUROC 0.893)和临床净收益(决策曲线分析显示阈值概率25-75%时优势显著)。该成果发表于《Scientific Reports》,为个性化康复干预提供了数据驱动的新范式。

关键技术方法包括:1)基于TRIPOD指南的横断面设计,样本来自单中心肺癌手术患者;2)采用最小绝对值收缩选择算子(LASSO)进行特征筛选;3)六种机器学习算法(决策树/随机森林/XGBoost/支持向量机/人工神经网络/K近邻)的构建与5折交叉验证;4)SHAP值分析实现模型可解释性;5)通过校准曲线和决策曲线分析(DCA)评估临床实用性。

基线特征
纳入患者中女性占比57.2%,中位年龄60岁,81.8%为初中以下学历。训练集与测试集基线特征无统计学差异(p>0.05),手术史(65.2%)和胸腔镜手术(98.1%)占主导。

特征选择
LASSO回归识别出10个非零系数变量,多因素Logistic回归最终确定6个独立预测因子:女性(OR=0.581)、低收入(<2000元 OR=0.626)、手术史(OR=1.903)、疼痛程度(VAS每增加1分风险升高28.8%)、社会支持(SSRS评分每增1分风险降3.4%)和积极应对方式(SCSQ评分每增1分风险降16.5%)。

模型性能
RF模型在测试集表现均衡:准确率80.3%、召回率87.0%、F1值0.795。其校准曲线最接近理想对角线,SHAP分析显示积极应对方式(特征重要性0.75)和疼痛程度(0.44)贡献度最高。相比"全干预"或"不干预"策略,RF模型在24-70%阈值概率区间提供最大净收益。

讨论与意义
该研究首次将可解释ML应用于肺癌术后运动恐惧症预测,揭示心理社会因素(如应对方式)比传统生物医学指标更具预测价值。RF模型的高召回率(87%)特别适合临床筛查场景,可减少漏诊高风险患者。局限性包括单中心样本和缺乏外部验证,未来需通过多中心研究提升泛化能力。

从临床实践看,研究提示应重点关注低收入女性术后患者,通过认知行为疗法改善应对方式,结合多模式镇痛和社会支持强化来打破"疼痛-恐惧-回避"的恶性循环。方法论上,SHAP值可视化实现了"黑箱"模型的临床可解释性,为AI辅助决策提供了透明化范例。这项成果不仅为肺癌康复开辟了新路径,其多维风险评估框架也可拓展至其他外科领域。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号