编辑推荐:
研究人员针对二元配对数据缺失值问题,开展 GEE 方法研究,结果表明该方法优势显著,意义重大。
在医学研究的广阔领域中,临床研究常常需要比较不同治疗方法的效果。当涉及到二元配对数据(比如对同一批患者在治疗前后进行评估,或者同时接受两种不同干预的效果对比)时,判断一种治疗方法是否不劣于另一种是关键问题。然而,现实却给研究人员出了难题,在这些研究中,数据缺失的情况频繁出现。以往的研究方法,如 Nam 和 Tango 提出的方法,虽然在处理完全观测数据时表现出色,但面对含有缺失值的数据却无能为力,这就导致大量潜在信息被浪费,统计效能大打折扣,进而可能影响对治疗效果的准确评估。
为了解决这些问题,来自 Charité - Universit?tsmedizin 的 Johannes Hengelbrock、Frank Konietschke 等人组成的研究团队开展了深入研究。他们的研究成果发表在《BMC Medical Research Methodology》上。该研究提出了一种基于广义估计方程(Generalized Estimating Equations,GEE)的灵活方法,用于估计风险差异的置信区间(Confidence Interval,CI),旨在为处理二元配对数据中的缺失值问题提供更有效的解决方案。
研究人员在本次研究中主要运用了以下关键技术方法:首先是模拟数据生成,通过 R 语言中的 bindata 包生成相关的二元数据,并按照特定规则引入缺失值,以模拟不同的缺失数据模式,包括完全随机缺失(Missing Completely at Random,MCAR)和随机缺失(Missing at Random,MAR) 。其次是多种统计方法的运用,包括基于完全观测对的传统方法(如 Nam/Tango 方法)、多重填补(Multiple Imputation,MI)构建 Wald 型置信区间的方法、混合置信区间(hybrid CIs)方法以及新提出的 GEE 方法。通过这些方法对模拟数据进行分析和比较。
下面来看具体的研究结果:
- 当非劣效性界值等于真实风险差异时:在无缺失数据的情况下,四种方法的功效相近,且接近名义单侧 α 水平(5%)。在 MCAR 缺失模式下,随着样本量增加,所有方法的功效都接近 5% ,小样本时则低于该水平。在 MAR 缺失模式下,Nam/Tango 和 Nam/Tango (MI) 方法的功效接近预期的 5% ,而 GEE 方法在样本量小于 100 时功效略高于 5%,在高患者内相关性和大量不平衡缺失的情况下,即使样本量达到 200,其功效仍超过 5%,大样本时才收敛到名义水平。混合 CI 在某些场景下功效过高(接近 20%),高患者内相关性和大样本时又低于 5%。在覆盖率方面,MCAR 模式下所有方法的覆盖率都接近或高于 90%,MAR 模式下 GEE 方法在小样本(n≤100)时覆盖率略低于 90%,而混合 CI 的覆盖率远低于 90%。
- 当非劣效性界值大于真实风险差异时:无缺失数据时,所有方法功效随样本量增加而增加,且在 VISIT STROKE 研究设定的参数下(ρ = 0.37,n = 507),所有方法功效为 80% ,同时功效随患者内相关性增加而增加。MCAR 模式下,所有方法功效随缺失概率增加而降低,其中基于完全观测对的 Nam/Tango 方法下降最明显,GEE 方法功效略高于 Nam/Tango (MI) 和混合 CI,尤其是在高正患者内相关性场景下。MAR 模式下,虽然混合 CI 功效最高,但因其 I 型错误率膨胀,GEE 方法在所有方法中功效最高,MI 方法相较于原始 Nam/Tango 方法也有所提升。在覆盖率方面,混合 CI 在 MAR 模式下覆盖率明显低于 90%,其他方法覆盖率高于 90% 且随样本量增加接近名义水平。在区间宽度方面,MCAR 模式下 GEE 方法的置信区间最窄,MAR 模式下混合 CI 区间最窄,但要考虑其膨胀的 I 型错误率。
在对 VISIT STROKE 研究的样本量计算进行重新分析时发现,若预期有 20% 的评估数据缺失,Nam/Tango 方法需要 634 名患者,而采用 MI 改进的 Nam/Tango (MI) 方法所需样本量为 594 名,新提出的 GEE 方法更为高效,仅需 590 名患者。
研究结论和讨论部分指出,在无缺失数据的场景下,基于 GEE 方法构建的置信区间在功效和区间宽度上与其他方法相当;在 MCAR 场景中,所有考虑的方法都比 Tango 的区间有所改进,GEE 区间在功效和区间宽度上略胜一筹;在不平衡缺失数据(MAR)场景下,混合方法的 I 型错误率膨胀,而 GEE 方法在中到大样本时仍能表现出较好的行为,在备择假设下功效最高。此外,GEE 方法还具有独特优势,它能够纳入额外的协变量,从而控制潜在混杂因素的影响,并检验治疗交互效应。不过,GEE 方法也存在局限性,即缺乏封闭形式的样本量公式,但可以通过基于模拟的样本量规划来解决。
总体而言,该研究提出的 GEE 方法为处理二元配对数据缺失值问题提供了更强大、灵活的解决方案,在医学研究的统计分析中具有重要意义,有助于更准确地评估治疗效果,推动临床研究的发展。