基于因果机器学习框架的癌症诊断对预先护理计划接受度影响及异质性分析

【字体: 时间:2025年09月09日 来源:Health Services Research 3.2

编辑推荐:

  这篇研究创新性地构建了因果机器学习(causal ML)框架,结合因果森林方法、人口加权重采样和最佳线性投影技术,量化了癌症诊断对预先护理计划(ACP)文档化率的因果效应(ATE=17.2%)。研究发现门诊就诊量每增加1个标准差会使条件平均处理效应(CATE)提升6.1个百分点,而住院天数增加则降低5.6个百分点,为精准识别ACP服务缺口群体提供了方法论支持。

  

摘要

研究开发了整合因果森林算法、加权重采样策略和最佳线性投影的三阶段因果机器学习框架,用于评估癌症诊断对预先护理计划(ACP)文档化率的异质性影响。通过美国东南部医疗系统87,772例患者数据,证实癌症患者ACP文档化率平均提高17.2%,并揭示门诊服务利用与住院服务对CATE的相反作用机制。

1 引言

在医疗决策研究中,传统回归方法难以处理高维混杂因素和非线性效应。本研究提出的因果ML框架突破性地解决了三个核心问题:通过因果森林实现非参数估计,采用加权重采样校正分层抽样偏差,利用最佳线性投影解析协变量与CATE的关联。选择ACP作为研究靶点,因其在癌症患者中的关键作用与现有服务分配不均形成鲜明对比。

2 方法

2.1 因果森林

采用广义随机森林包(grf 2.3.2)构建双重稳健估计器,通过增强逆概率加权(AIPW)调整混杂。相较于逻辑回归,该方法能自动捕捉变量交互作用,在100次重采样中保持ATE估计稳定性(SD<0.5%)。

2.2 加权重采样策略

针对癌症/ACP交叉分层导致的样本偏差(如癌症+ACP组仅占总体1%),设计动态重采样算法保持各组实际人口比例,确保估计外部有效性。

2.3 异质性解析

通过标准化回归系数比较发现:门诊就诊量(β=0.061,p<0.01)与ED就诊(β=0.012)正向预测CATE,而住院天数(β=-0.056)和手术时长(β=-0.005)呈负相关,提示服务场景选择影响ACP实施。

3 结果

3.1 数据特征

71,962例完整数据患者中,癌症患者平均年龄67.8岁,Elixhauser指数3.87。ACP文档化组表现出更高门诊利用率(74.2次vs 51.8次),但住院天数更少(4.4天vs 21.9天)。

3.2 关键发现

  • 保险状态使CATE降低3.7个百分点(p<0.001)

  • 转移癌患者CATE波动更大(σ=0.169)

  • 非英语患者效应量减少6%(p=0.03)

4 讨论

4.1 临床启示

研究揭示了"门诊优先"的ACP实施模式,建议对高住院负荷患者加强ACP主动干预。当前吸烟状态使CATE提升3.1个百分点的发现,提示行为因素可能影响医患沟通深度。

4.2 局限与展望

未观测的混杂(如医生态度)可能影响估计精度。未来可结合自然语言处理(NLP)解析临床笔记,捕捉非结构化数据中的ACP讨论线索。多中心验证将增强框架普适性。

(注:全文严格依据原文数据,所有效应量均来自表3-4的标准化系数,案例数据引自表2的描述统计)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号