贝叶斯 p 曲线混合模型:解开效应量与效应普遍性谜题的有力工具

【字体: 时间:2025年01月23日 来源:Communications Psychology

编辑推荐:

  在行为科学研究中,常用的群体平均效应量解读存在问题,难以区分效应普遍性和效应量。研究人员引入贝叶斯 p 曲线混合模型(P -curve mixture model),该模型能联合估计普遍性和效应量,且在不确定性情况下表现出色,有助于更准确地理解研究结果。

  在行为科学的研究领域中,一直存在着一些令人困惑的问题。许多研究都试图描绘 “典型” 个体的特征,可在实际操作中,通过统计得出的群体平均效应量却常常被误读。通常,当研究发现群体平均效应量在统计上显著时,人们往往会认为这意味着 “典型” 个体也呈现出该效应。但事实并非如此简单,这种解读是基于一系列默认却很少被明确提出的假设。比如,认为群体条件均值能代表 “群体代表性参与者” 的条件反应,实际参与者的测量值只是围绕这一中心趋势的噪音,远离均值的参与者则被当作 “异常值” 可随意舍弃 。但现实里,即使只有少数个体表现出效应,群体均值也可能与零假设值有显著差异。就像在一些心理学和认知神经科学实验中,当干预导致某变量在不同条件或群体间出现差异时,显著的群体水平效应并不一定意味着大多数参与者都有此效应。
此外,群体平均效应量还受到个体内效应量和群体患病率(population prevalence,指群体中表现出某种效应的参与者比例)的双重影响。若效应在人群中存在差异,即部分人有此效应,部分人没有,那么样本均值就会被 “稀释”,无法准确代表任何一个子群体。而且,当前研究很少考虑患病率对平均效应量估计的影响,现有的患病率估计方法也常因效应量的不确定性而受到干扰。这些问题严重影响了研究结果的准确性和可靠性,也阻碍了对行为科学现象的深入理解。

为了解决这些问题,来自美国芝加哥大学(University of Chicago)心理学系的 John P. Veillette 和 Howard C. Nusbaum 开展了一项重要研究。他们引入了一种广泛适用的贝叶斯方法 ——P 曲线混合模型(P -curve mixture model)。通过该模型,研究人员能够联合估计患病率和效应量,为行为科学研究带来了新的曙光。这一研究成果发表在《Communications Psychology》上,为该领域的发展做出了重要贡献。

研究人员在研究中主要运用了以下关键技术方法:

  1. 贝叶斯混合模型(Bayesian mixture model):这是一种将观测数据假定来自多个不同组的建模方法,通过概率聚类,可同时推断各分组的比例和组内观测值的分布。
  2. p 曲线(p -curve):利用重复实验得到的独立 p 值的概率密度来构建模型。在零假设下,p 曲线服从均匀分布;在备择假设下,效应量或样本量越大,p 曲线越向左偏。
  3. 马尔可夫链蒙特卡罗(Markov - Chain Monte Carlo,MCMC)方法:用于从后验分布中采样,以近似估计模型参数的后验分布。

下面来详细看看研究结果:

  1. 患病率估计基准:研究人员通过模拟不同样本量、不同个体内统计检测效应的能力(即统计功效,statistical power)的场景,对比了 P 曲线混合模型和二项式模型(Binomial model)在患病率估计方面的表现。结果发现,P 曲线混合模型的后验均值随着样本量增加更接近真实患病率;而二项式模型无法区分群体患病率和个体内统计功效,其估计值会收敛于两者的平均值。此外,P 曲线混合模型的 95% 最高密度区间(95% highest density interval,95% HDI)会随着数据增加而缩小,不确定性降低,且在实际应用中,其 95% HDI 的错误覆盖率接近或低于 5%,表现与频率主义的 95% 置信区间相当。
  2. 对异质性的稳健性:在不同程度的个体间效应量异质性模拟中,P 曲线混合模型在所有测试水平下,95% 后验 HDI 的错误覆盖率均保持在 5% 以下,表明该模型对效应量异质性具有较强的稳健性。
  3. 在 EEG 数据中检测组间和组内差异的敏感性:研究人员模拟 EEG 事件相关电位(event - related potential,ERP)数据,对比 P 曲线模型与群体水平零假设显著性检验(null hypothesis significance testing,NHST)以及二项式模型检测组间和组内患病率及个体内效应量差异的敏感性。结果显示,P 曲线混合模型对群体患病率和个体内效应量的变化高度敏感,且能准确区分两者差异,在检测个体内效应量变化方面优于 NHST。

在研究结论和讨论部分,研究人员指出,P 曲线混合模型为行为科学研究提供了更全面、准确地描述效应分布的工具。它不仅能帮助研究人员更好地理解研究结果在群体中的普遍性,还能在一定程度上解决当前行为科学研究中的可重复性危机问题。通过明确估计患病率和效应量,研究人员可以更准确地评估研究结果的实际意义和应用价值,为后续的基础科学研究转化为临床应用提供关键的量化指标。

然而,P 曲线混合模型也存在一些局限性。例如,该模型假设存在真正的零效应,这在某些情况下可能并不合理;它还假设在零假设下重复独立的 p 值分布是均匀的,若计算 p 值的程序假设被违反,模型估计结果可能不佳;另外,患病率估计仅适用于研究样本所来自的群体,且模型无法检测部分参与者效应方向与群体平均相反的情况,也难以刻画效应量分布的多峰特征。

尽管如此,P 曲线混合模型在行为科学研究中仍具有重要意义。它为研究人员提供了一种强大的工具,使得在面对复杂的群体异质性问题时,能够更深入地剖析研究数据,得出更可靠的结论。在未来的研究中,研究人员可根据具体研究问题和数据特点,合理选择使用 P 曲线混合模型或其他方法,进一步推动行为科学领域的发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号