《Journal of Clinical Epidemiology》:Sample Size Determination for Decision-centered Pragmatic Trials
编辑推荐:
Iztok Hozo|Lars G. Hemkens|Benjamin Djulbegovic美国印第安纳州加里市,印第安纳大学西北分校数学系摘要研究目的旨在为实用随机试验中确定样本量开发一种决策分析方法,以此选出更优的治疗方案。该方法以利益相关者所定义的最小重要差异作为依据。最
Iztok Hozo|Lars G. Hemkens|Benjamin Djulbegovic
美国印第安纳州加里市,印第安纳大学西北分校数学系
摘要
研究目的
旨在为实用随机试验中确定样本量开发一种决策分析方法,以此选出更优的治疗方案。该方法以利益相关者所定义的最小重要差异作为依据。最小重要差异决定了可接受的遗憾程度,即利益相关者愿意承受的因错误决策而造成的预期损失,同时还涉及选择错误方向的概率。
研究设计与背景
我们运用决策树对双臂随机试验进行了建模,其中净临床益处综合考虑了治疗带来的益处与危害,并根据利益相关者的价值观和偏好进行加权,这些偏好通过疾病结果与危害的相对价值来体现。我们制定的决策规则是选择净益处估算值更高的治疗方案。样本量的设定需确保因错误决策造成的预期损失不超过可接受的遗憾程度。我们通过蒙特卡洛模拟将这种决策分析方法与传统的频率主义设计方法(第一类α错误和第二类β错误控制)进行了比较,还通过重新计算四项近期具有重大影响力的实用试验的样本量来说明该方法的应用。同时提供了Stata程序和在线计算工具。
研究结果
在10,000次模拟中,采用决策分析方法所需的参与者数量平均仅为传统解释性、频率主义导向随机试验的一半左右(平均样本量89人对比168人)。在四项近期开展的实用试验中,有三项的样本量减少了47%到72%,这一减少幅度取决于所假设的相对价值与可接受的遗憾程度。在第四项试验中,该框架揭示了假设的效应差异、利益相关者偏好以及可承受的决策风险之间的矛盾——这表明,在效应大小极小的情况下,试验设计者要么放宽可接受的遗憾程度标准,要么调整试验问题,要么认定预期决策价值不足。
结论
以决策质量为核心来设计实用随机试验,不仅能够做到透明且符合伦理要求,而且在假设合理的情况下还能大幅减少样本量,进而降低试验参与的门槛,加快实用型有效证据的生成速度。
通俗语言总结
通常首先会在受控的“实验室”环境中通过“解释性”试验来检测某种治疗是否有效。但要在实际应用中确定该选用哪种治疗,就需要开展“实用型”试验,即在真实环境中让代表性患者接受不同治疗方案的比较。其中一个关键难题就是确定合适的参与者数量——参与者太少会增加选择错误治疗的风险,而太多则会浪费资源并使人们面临不必要的风险。目前用于确定实用型试验样本量的以决策为导向的方法还较为有限。
我们的研究旨在弥补这一缺陷。我们提出了一种以患者为中心的方法,该方法从患者和临床医生认为治疗之间存在的重要差异出发,据此确定可接受的错误选择概率,也就是所谓的“可接受的遗憾程度”。该方法同时考量了每种治疗的益处与危害。通过计算机模拟,我们可以确定出能在可接受风险范围内保持最低样本量的数值。
在众多模拟场景以及四项知名实用试验中的三项中,我们的方法相比传统方法所需参与者更少,却仍能解答这些试验原本要解决的问题。在第四项试验中,该框架表明目标效应太小,无论采用何种可行的样本量都无法实现有效检测——这一结果有助于揭示传统方法可能隐藏的问题。这种方法能够让实用型试验更快、成本更低,更快得出结果,加速更好治疗方法的推广,同时也能更符合伦理地利用参与者的贡献。