基于贝叶斯加性回归树(BART)与集成嵌套拉普拉斯逼近(INLA)的空间协变量建模与预测框架BARTSIMP的开发与应用研究
【字体:
大
中
小
】
时间:2025年10月11日
来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3
编辑推荐:
本文推荐一种创新的空间统计建模框架BARTSIMP(BART for Spatial INLA Modeling and Prediction),该模型巧妙融合贝叶斯加性回归树(BART)的灵活协变量建模能力与高斯随机场(GRF)的空间依赖性刻画优势,通过INLA-within-MCMC算法实现高效计算。该研究突破了传统线性空间模型的局限,在保留贝叶斯不确定性估计的前提下,显著提升复杂空间数据(如分层两阶段不等概率整群抽样调查数据)的预测精度,为公共卫生领域的空间统计分析提供强有力工具。
本研究受肯尼亚2014年人口与健康调查(DHS)中儿童营养不良数据的启发。我们重点关注五岁以下儿童的消瘦状况,该指标通过体重身高Z评分(WHZ)进行量化。Z评分可解释为:相较于同身高人群的中位值,某儿童的体重偏离中位值的标准差单位数(Mei和Grummer-Strawn, 2007)。例如,WHZ低于-2通常被定义为消瘦,表明该儿童体重严重不足。
为阐明数据框架并引入符号系统,我们将在3.1节概述传统的线性空间模型。随后在3.2节介绍BART模型,并在3.3节提出我们将其空间化的版本。模型的先验设置将在3.4节进行说明。
Overview on the algorithm
对于标准BART模型,在模型参数采用共轭先验的前提下,存在一种高效的吉布斯型采样器(Chipman et al., 1998)。然而,一旦模型中加入了空间随机效应成分,其计算便面临可扩展性挑战。在我们的模型框架下,标准的马尔可夫链蒙特卡罗(MCMC)算法需要对空间随机场 z 进行采样和存储,这在计算上是不可取的。因此,我们的策略是将 z 积分掉,进而对相应的边际似然进行操作。
在本节中,我们研究了几种模拟情景,这些情景中空间信号和协变量信号的强度各不相同。我们考虑在一个研究区域 [0,1]×[0,1] 上构建一个50×50的网格表面,并将网格单元的集合记为 G。对于每个网格单元关联的协变量,我们独立地从[0,1]上的均匀分布中生成了两个协变量。令 xgp, p=1,2 代表网格单元 g 的第 p 个协变量,并令 xg = (xg1, xg2), g∈G。则在网格单元 g 处评估得到的真实确定性场为...
在本节中,我们基于2014年肯尼亚DHS的WHZ测量数据,研究了BARTSIMP模型与BART、SPDE以及SPDE0模型在预测性能上的比较。
在这项工作中,我们提出了BARTSIMP作为一个新颖的框架,用于对空间数据集进行灵活的协变量建模与预测。我们将BART的非参数特性融入了连续空间模型,并利用BART的灵活性来允许非线性的协变量关系和交互效应。为了实施该模型,我们基于INLA-within-MCMC技术为BARTSIMP开发了一种基于采样的推断算法。BARTSIMP存在一些局限性,需要进一步的研究...
(根据要求,此处翻译到第二个Conclusion在内的部分,即Discussion小节。后续的CRediT和Declaration部分未在指定翻译范围内。)
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号