因果森林:解锁重症治疗效果差异密码,开启个性化医疗新征程 ——VANISH 试验二次分析

【字体: 时间:2025年02月23日 来源:BMC Medical Research Methodology 3.9

编辑推荐:

  为解决随机对照试验(RCTs)中识别异质性治疗效果(HTEs)的问题,英国研究人员开展因果森林等方法分析 VANISH 试验数据的研究,发现血清钾影响 HTEs ,因果森林有应用潜力。推荐阅读,探索医疗研究新方向!

  
在医学研究的世界里,随机对照试验(RCTs)一直是寻找有效新疗法的重要手段。它通过估算平均治疗效果(ATE),来判断一种干预措施是否有效。就好比是给一群学生吃同一种 “学习药丸”,看看他们的平均成绩有没有提高。但实际上,学生们的成绩提升情况各不相同,有的进步很大,有的却没什么效果,甚至还有退步的。在医学治疗中也是如此,不同患者对同一种治疗的反应差异很大,这就是所谓的个体治疗效果异质性(HTEs)。

在重症监护领域,这个问题尤为突出。这里的患者情况复杂多样,治疗成本高昂,每一项资源的分配都至关重要。然而,许多重症监护相关的试验却得出了无效的 ATE 结果,这就像是 “学习药丸” 对这群学生整体没什么效果,但其实可能对部分学生是有帮助的,只是被平均结果掩盖了。如果能更好地理解 HTEs,就能继续针对可能受益的患者进行研究,避免资源浪费,让治疗更精准有效。

传统的 HTEs 估算方法存在不少问题。它就像一个 “慢吞吞的老学究”,需要预先计划好亚组分析,而且对样本量要求很高。通常是一个一个地去测试患者特征与治疗效果之间的相互作用,要是同时测试多个特征,还容易出错。就好比在一堆拼图中,一块一块地找特定的拼图,不仅效率低,还容易找错。

随着科技的发展,因果机器学习(CML)方法出现了,它就像是一个 “神通广大的魔法师”,可以更灵活地估算 ATE 和 HTEs。其中,因果森林(CF)方法备受关注,它能在一次分析中考虑很多可能的治疗效果修饰因素。不过,这种方法在临床试验中的应用还比较少,而且它生成的亚组可能很难解释,就像魔法师变出来的东西让人摸不着头脑。所以,研究人员就想探索一下 CF 方法在估算 HTEs 方面的表现,并和传统方法以及数据自适应方法(比如分层 lasso 回归)做个比较。

为此,英国的研究人员在《BMC Medical Research Methodology》期刊上发表了一篇名为《Using causal forests to estimate heterogeneous treatment effects in a randomized controlled trial: a secondary analysis of the VANISH trial》的论文。他们通过研究得出结论:因果森林在识别血清钾水平导致的 HTEs 方面,与数据自适应和传统的亚组分析方法结果一致;因果森林提取根分裂值来确定亚组的方法很新颖,有助于发现新的研究方向,但还需要进一步研究;同时,研究还发现血清钾水平是影响治疗效果异质性的重要因素,高钾水平与较差的治疗反应相关。这一研究意义重大,它为个性化医疗提供了新的思路,让医生有可能根据患者的具体情况,更精准地选择治疗方案,就像为每个学生量身定制一套学习方法,提高学习效果。

为了开展这项研究,研究人员用到了几个关键的技术方法。首先是数据处理,他们对 VANISH 试验收集的数据进行筛选,把缺失值小于 30% 的基线测量数据当作可能的治疗效果修饰因素,对分类变量进行独热编码,对连续变量进行中心化和标准化处理。接着是分析方法,传统方法采用单变量回归,通过单独的逻辑回归模型测试每个协变量与治疗的相互作用,并使用 Bonferroni 多重检验校正来减少错误;机器学习方法采用分层 lasso 回归,通过这种变量选择技术来挑选与治疗有强相互作用的基线协变量;因果机器学习方法则是使用因果森林,它能估算条件平均治疗效果(CATE),通过样本拆分来确定树的分裂和估计治疗效果,研究人员还对因果森林进行了扩展,提取根分裂值来定义数据驱动的亚组。

下面我们来看看具体的研究结果。

基线特征


研究人员分析了 VANISH 试验中的所有参与者,在去除高缺失率和高相关性的变量后,还剩下 49 个基线变量。这些变量在治疗组之间分布得比较均衡,这得益于随机化分组。这就好比把学生随机分成几个小组,每个小组的学生情况都差不多。

单变量回归


单变量回归分析就像是一个 “探测器”,去寻找哪些因素和治疗效果有关系。结果发现,血清钾与治疗效果的相互作用显著,血钾水平升高与治疗后较差的生存机会相关,比值比(OR)为 0.435 (95% 置信区间 [0.270, 0.683],p = 0.0004)。虽然缺血性心脏病和癌症也与治疗效果有关,但经过多重检验校正后,这两个结果就不显著了。就好像在寻找宝藏的过程中,发现了几个疑似宝藏的东西,但经过仔细检查,只有血清钾这个 “宝藏” 是真的有价值。

分层 lasso 回归


分层 lasso 回归模型就像是一个 “筛选器”,它保留了 9 个相互作用及其相应的主效应。其中,钾与 28 天存活机会降低有关(标准化 OR:0.604,95% CI (0.259, 0.701))。通过这个模型,研究人员可以了解哪些因素对治疗效果的影响比较大,就像筛选出对学习成绩影响较大的因素一样。

因果森林


因果森林这个 “神奇工具” 通过综合测试发现了 HTEs 的微弱证据,它还发现试验人群中 CATE 的分布近似双峰,这意味着可以把人群分成不同的亚组。而且,因果森林发现血清钾是最重要的变量,以 4.68 mmol/L 为界,将患者分为低钾和高钾两组,两组的亚组 GATEs(28 天死亡率的风险差异)分别为 0.069(95% CI [-0.032, 0.169])和 -0.257(95% CI [-0.368, -0.146]) 。这就像是把学生按照某个重要特征分成了两个小组,发现这两个小组在学习效果上有很大差异。

敏感性分析


在敏感性分析中,研究人员发现,当用总结分数代替其组成部分进行分析时,因果森林没有发现明显的异质性信号;在处理缺失数据的几种方法中,均值插补的结果和主要分析相似,而其他方法会减少样本量,增加分析难度。这就好比在不同的 “路况” 下测试一辆车,看看它的性能有没有变化。

模拟研究


模拟研究就像是在虚拟世界里做实验。结果显示,因果森林结合根分裂能 100% 正确识别出 X2 是治疗效果修饰因素,而且能得到很接近真实值的阈值。相比之下,传统单变量分析和分层 lasso 回归虽然能检测到异质性信号,但无法确定亚组的阈值。这就好比在虚拟世界里,因果森林能准确找到宝藏的位置,而其他方法只能知道宝藏大概在哪个方向,却找不到具体位置。

综合研究结论和讨论部分,这项研究意义非凡。它发现了血清钾水平对治疗效果异质性的重要影响,为后续研究指明了方向。因果森林在识别 HTEs 方面展现出了潜力,它能处理大量变量,还能找到新的亚组划分阈值,这是传统方法做不到的。不过,目前的研究也存在一些局限性,比如研究是探索性的,结果可能效力不足,需要在其他队列中进行验证;因果森林定义亚组的不确定性估计还需要进一步研究;VANISH 试验的样本量较小,还需要确定合适的样本量并进行外部验证等。但这并不影响它为个性化医疗开辟新的道路,未来研究人员可以基于这些发现,进一步优化方法,让治疗更加精准有效,就像为每个患者打造一把专属的 “治疗钥匙”,打开健康的大门。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号