基于机器学习模型的中国肺癌患者支持性照护需求探索与预测

【字体: 时间:2025年06月14日 来源:Supportive Care in Cancer 2.8

编辑推荐:

  这篇综述通过横断面研究(cross-sectional study)和机器学习(ML)技术,系统评估了中国486例住院肺癌患者的支持性照护需求(SCN),发现教育水平和家庭人均月收入是主要影响因素。研究采用随机森林(RF)等6种算法构建预测模型,RF模型在预测总需求评分时MAE为4.45,预测最高需求维度的准确率达88.42%。成果为临床个性化护理(personalized care)提供了数据驱动的决策工具,但需注意交叉验证可能导致的性能高估。

  

研究背景与意义

肺癌作为全球死亡率最高的恶性肿瘤,在中国预计2030年死亡病例将增长42.7%。肺癌治疗带来的生理和心理压力显著影响患者生活质量(QoL),90%新确诊患者存在未满足的需求。支持性照护需求(Supportive Care Needs, SCN)涵盖信息、心理、生理等多维度,但传统评估方式效率低下。人工智能(AI)与大数据技术的结合为精准预测SCN提供了新思路。

研究方法

研究纳入广东某三甲医院486例住院肺癌患者,采用支持性照护需求简表(SCNS-SF34)评估需求水平,包含健康系统与信息、性需求等5个维度。通过单因素分析发现年龄、教育水平、职业、肿瘤分期和家庭收入显著影响需求评分(P<0.05),多因素线性回归进一步确认教育水平(β=0.24)和家庭收入(β=-0.18)为关键预测因子。

机器学习建模采用6种算法:

  1. 线性/逻辑回归:基础GLM模型
  2. 支持向量机(SVM):通过核函数处理非线性特征
  3. K近邻(KNN):基于欧氏距离的相似性分类
  4. 随机森林(RF):集成决策树,Gini重要性评估特征
  5. 自适应提升(AdaBoost):增强弱分类器性能

特征工程中,年龄离散化(18-40/41-60/61-90岁)后采用独热编码,避免归一化导致的性能下降(图6-7)。

核心发现

  1. 需求维度排序:健康系统与信息需求最高(84.8%),其次为患者照护支持(75.2%),性需求最低(34.8%)。
  2. 预测性能
    • RF模型预测总需求评分的R2
      =0.57,显著优于线性回归(R2
      =0.04)
    • 最高需求维度预测的ROC-AUC达0.9061,F1分数87.49%
  3. 特征重要性:教育水平、肿瘤分期和病理类型在两类预测任务中均位列前5关键特征(图5)。

临床启示

低教育水平患者因信息获取能力差,对健康系统需求更迫切;经济压力大的家庭(月收入≤2000元)需求评分更高。研究建议:

  • 针对化疗患者重点管理疲劳、恶心等不良反应
  • 对早期患者加强疾病知识科普(如科室讲座、病友分享)
  • 通过RF模型预筛高风险患者,优化护理资源分配

局限与展望

横断面设计无法追踪需求动态变化,且样本仅来自单一中心。未来需扩大样本量并开展外部验证,探索自然语言处理(NLP)技术在需求文本分析中的应用潜力。

(注:全文数据与结论均源自原文,未新增推断;专业术语如SCNS-SF34、ROC-AUC等均按原文格式保留)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号