疫苗效力（VE）精准评估新突破：基于全似然贝叶斯模型的小中型样本置信区间优化研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Pharmaceutical Statistics》：New, Shorter Small-Sample Intervals for Vaccine Efficacy

【字体：大中小】 时间：2026年02月19日 来源：Pharmaceutical Statistics 1.4

编辑推荐：

　　本文针对疫苗临床试验中样本量有限时疫苗效力（Vaccine Efficacy, VE）估计不够精确的问题，提出了一种创新的全似然贝叶斯方法，旨在提升VE估计的准确性。该方法核心在于将总病例数和删失的监测时间均视为具有基础分布的随机变量，并通过推导完整似然函数，将其纳入贝叶斯分析框架。相较于依赖病例数或仅利用监测时间一阶矩的传统方法，新方法可有效利用患者入组过程的随机性信息，显著改善了在小中型样本下VE参数的区间估计。模拟验证显示，该方法在不同场景和入组计划下均能提供更窄的置信区间，且不会降低覆盖率。对于大样本，其效能与最大似然法相当。该研究为疫苗临床试验，特别是亚组分析或中小型试验的设计与评估，提供了更为可靠和精确的统计分析工具。

在疫苗临床研究的核心评价指标中，疫苗效力（Vaccine Efficacy, VE）用于衡量实验组相比对照组在降低疾病发生风险方面的成效。然而，当临床试验的样本量较小或中等时，如何更精确地估计VE及其置信区间，始终是统计学家面临的一项挑战。传统方法，如条件于总病例数的贝叶斯方法（Conditional Bayesian, CB）或基于精确二项分布的Clopper-Pearson（CP）方法，通常将观察到的总病例数和受试者的监测时间（surveillance time）视为常数，并未充分利用这些数据作为随机变量所蕴含的统计信息，特别是未能充分考虑患者入组过程对监测时间随机性的影响。这在一定程度上限制了VE估计在小样本情境下的精度。

本文提出了一种名为“全似然贝叶斯（Full-likelihood Bayesian, FB）”的新方法，旨在克服上述局限性。该方法的核心创新在于，将每个受试者贡献的感染事件（是否发病）和监测时间（在观察期内暴露于感染风险的时间长度）的联合分布纳入建模框架。研究者通过一个双变量中心极限定理（Bivariate Central Limit Theorem）推导了感染数和监测时间这两个统计量的渐进联合正态分布，该分布的方差不仅依赖于感染率参数，还依赖于监测时间的一阶矩和二阶矩，从而巧妙地捕获了入组过程（如均匀入组、贝塔分布入组等）的随机性特征，而无需对入组过程的具体形式做过多假设。这种方法使得模型能够从数据中提取更多关于VE的信息。

1. 理论基础与模型构建

研究首先回顾了当前主要的VE统计区间估计方法。VE通常定义为1减去发病率比（Incidence Rate Ratio, IRR）。在标准的两组比较试验中，数据可概括为疫苗组和对照组的样本量、感染病例数以及以“人-年”为单位的监测时间。最大似然估计（Maximum Likelihood, ML）和基于其的渐进置信区间是常用方法，但小样本下表现不佳。条件贝叶斯（CB）方法则假定给定总病例数下，疫苗组病例数服从二项分布，并将监测时间作为固定常数代入模型，这是一种“部分”贝叶斯方法。

本研究的FB方法走得更远。它建立了一个完整的层次模型：模型顶层参数是目标参数VE和对照组的感染率参数λ_c。由VE和λ_c可推算出疫苗组的感染率λ_v。然后，假设疫苗组和对照组的（感染数，监测时间）统计量分别服从一个双变量正态分布，其均值向量和协方差矩阵由λ_v, λ_c、样本量以及监测时间的一二阶矩决定。通过为VE（通常假设其logit变换服从正态先验）和λ_c等参数设置先验分布（如弱信息先验），构成了一个完整的贝叶斯模型。由于模型没有闭合形式的后验解，研究者采用马尔可夫链蒙特卡洛（Markov Chain Monte Carlo, MCMC）方法进行后验抽样推断。

2. 模拟验证与性能评估

为了验证FB方法的优越性，研究进行了大规模的数值模拟。模拟设置了不同的真实VE值（从0.1到0.9）、两种患者入组模式（均匀分布和Beta(2,2)分布），并通过控制总感染事件数（E_total）在40到900之间，来生成小、中、大不同规模的数据集。在每个模拟场景下，比较了FB方法与条件贝叶斯（CB）、Clopper-Pearson（CP）和最大似然（ML）这三种现有方法。

评估主要关注两个指标：一是95%区间（对贝叶斯方法是可信区间，对频率学派方法是置信区间）的覆盖率，衡量方法的校准程度（是否接近名义95%水平）；二是区间宽度，衡量估计的精确性。

模拟结果显示：

•
覆盖率：FB和CB方法的平均覆盖率都非常接近95%的名义水平。而CP和ML方法则表现出保守性，其覆盖率持续高于95%，尤其是在事件数较少时。所有方法均可视为校准良好。
•
区间宽度：FB方法在所有场景下都一致地提供了比其他方法更窄的区间，表明其估计精度更高。这种精度优势在事件数较少（小中型样本）时尤为显著。例如，当预期总感染数E_total=40时，相比于CB、CP和ML方法，FB的区间宽度平均可减少约3-5%、13-16%和7-18%不等。随着事件数增加到900（大样本），所有方法的区间宽度趋于一致，FB与ML方法的表现几乎等价，这与理论上的渐进性质相符。

3. 实例应用：重新分析辉瑞/BioNTech新冠疫苗试验数据

为展示其实用价值，研究者将FB方法应用于已发表的辉瑞/BioNTech COVID-19疫苗关键试验数据，包括整体人群和多个亚组（如男性、65岁以上人群、巴西人群等）。分析涵盖了不同截止时间点（2020年11月和2021年3月）的数据。

所有方法得出的VE点估计值非常接近，但区间宽度存在明显差异。在感染数较少（约10-20例）的亚组中（如巴西亚组、65岁以上亚组），FB方法的精度优势最大：其95%可信区间宽度比CB窄约5-12%，比CP窄约21-34%，比ML窄约33-38%。在感染数中等（几十例）的亚组中，FB仍能提供1.5-3.5%（相对于CB）和12-14%（相对于频率学派方法）的宽度缩减。在感染数超过900例的总体分析中，所有方法的区间宽度几乎相同，再次印证了大样本下方法收敛的结论。

4. 讨论与结论

本文提出的全似然贝叶斯（FB）方法，通过联合建模感染数和监测时间，并利用其渐进联合分布，成功地将患者入组过程的随机性信息整合到VE的估计中。这弥补了传统条件方法（CB）将监测时间视为固定常数而损失部分信息的不足。

该方法的主要优势在于：

•
更高的精度：在中小样本下能提供更窄的置信/可信区间，而不牺牲覆盖率，这对于样本量有限的亚组分析或早期中期临床试验至关重要。
•
良好的灵活性：模型不依赖于特定的入组过程分布假设，仅需监测时间的一二阶矩信息，使其适用于多种实际的临床试验招募场景。
•
理论一致性：随着样本量增大，其结果与最大似然估计法渐近等价。

当然，FB方法需要借助MCMC进行后验计算，相比有闭合解的CB方法在计算上稍复杂，但对于所构建的模型而言，计算效率仍然很高，不构成实际应用障碍。

总之，这项研究为疫苗效力的统计推断提供了一种更为强大和精确的工具，尤其能够提升在有限样本条件下研究结论的可靠性，对未来的疫苗临床试验设计和数据分析具有重要的参考价值。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号