编辑推荐:
在贝叶斯框架下,确定权重参数的先验分布颇具挑战。研究人员开展 “通过校准贝叶斯因子(CBF)从临床试验中引出先验信息” 的研究。结果表明 CBF 能选更优先验,提升推断精度。该研究为临床试验分析提供新方法,意义重大。
在生物统计学领域,临床试验常面临样本量不足的困境,这使得准确估计参数变得困难。与此同时,大量的历史或相关数据却往往闲置一旁。为了充分利用这些历史数据,增强新研究的设计与分析效果,研究人员将目光投向了贝叶斯方法。贝叶斯方法凭借其能有效整合先验信息的特性,在临床试验等研究中受到广泛关注。其中,功率先验分布(power prior distributions)更是备受青睐,它能将历史数据融入到先验分布中,从而提升统计推断的稳健性和效率。
然而,在实际应用中,确定功率先验分布中的权重参数(δ)面临诸多挑战。这个权重参数决定了历史数据对当前分析的影响程度,若设置不当,可能导致历史数据过度主导后验推断结论,或者无法充分利用历史数据的价值。尽管已有多种策略来设定权重参数,如将其视为固定值或随机变量,但在完全贝叶斯框架下,引出权重参数的初始分布仍是一个未被充分探索的难题。为了解决这些问题,研究人员开展了一项关于 “通过校准贝叶斯因子(CBF)从临床试验中引出先验信息” 的研究,其成果发表在《Computational Statistics 》上。
研究人员采用了多种关键技术方法。首先是桥抽样(bridge sampling)技术,用于计算复杂模型下难以直接求解的边际似然,这是计算贝叶斯因子(BF)的关键步骤。其次,通过模拟基于后验预测分布生成的假设复制数据,来近似贝叶斯因子的分布,从而对贝叶斯因子进行校准,得到校准贝叶斯因子(CBF)。在实际数据处理中,运用概率编程软件 Stan 和 R 语言中的hdbayes包进行马尔可夫链蒙特卡罗(MCMC)抽样,以此进行参数估计。
研究结果主要通过模拟研究和真实数据应用两部分呈现。
- 模拟研究:考虑了泊松对数线性模型、二项模型和高斯模型三种场景。在泊松对数线性模型模拟中,生成历史数据集和一系列逐渐偏离的当前数据集。结果显示,随着当前和历史研究之间分歧的增加,CBF 选择的先验从倾向于大量整合历史数据的左偏 Beta 分布,转变为更保守整合历史信息的右偏 Beta 分布。同时,使用 CBF 选择先验的归一化功率先验(NPP)在估计回归系数时,边际后验分布更集中,结果更精确。在二项模型模拟中,同样观察到 CBF 能根据当前和历史数据的一致性动态调整历史信息的借用程度。当数据一致性高时,选择的先验会更多地借用历史信息;反之则减少借用。而且,CBF 先验得到的边际后验分布在不同数据一致性情况下都更集中,推断结论更准确。高斯模型模拟中,CBF 能有效选择平衡先验,以适应原始和复制研究之间的一致性水平。随着分歧增大,选择的先验逐渐减少历史信息的纳入。并且,CBF 选择的先验能降低边际后验的标准差,提升估计效果。
- 真实数据应用:研究人员分析了两项黑色素瘤临床试验(E2696 和 E1694)的数据。通过将 E2696 的历史数据与 E1694 的新数据结合,运用贝叶斯逻辑回归模型和 NPP 进行分析。结果表明,CBF 选择的先验(Beta (5, 0.5))使得治疗、性别和体能状态参数的后验标准差更小,95% 最高后验密度区间(HPDI)更窄,这意味着能得到更精确的推断结论。
在结论和讨论部分,研究人员指出,功率先验方法虽为构建信息先验提供了灵活途径,但确定合适的权重参数仍是挑战。CBF 程序是应对这一挑战的创新方法,它能选择比传统非信息先验更优的先验,在模拟研究和黑色素瘤数据应用中都展现出强大的稳健性和有效性。尽管该方法计算成本较高,但通过调整计算参数或采用并行计算,可在保证精度的同时降低成本。此外,研究还存在一些可改进之处,如优化选择标准、探索替代网格搜索的方法以及深入分析 CBF 方法的理论性质等。这项研究为临床试验的数据分析提供了新的有力工具,有望推动相关领域的进一步发展。