
-
生物通官微
陪你抓住生命科技
跳动的脉搏
功能性高斯图回归模型在空气质量数据中的应用:揭示大气污染物垂直分布与气象条件的交互作用
【字体: 大 中 小 】 时间:2025年08月22日 来源:Journal of the Royal Statistical Society Series C: Applied Statistics 1.0
编辑推荐:
研究人员针对大气污染物垂直分布与气象条件的复杂交互问题,开发了功能性高斯图回归模型(fGGRM),通过In-service Aircraft for a Global Observing System(IAGOS)数据,结合Karhunen-Loève(K-L)展开和双重惩罚估计方法,揭示了O3、CO、NO和H2O的依赖结构及温度驱动机制,为环境统计学提供了创新分析工具。
大气污染物的垂直分布与气象条件的动态交互是环境科学的核心问题。传统统计方法难以捕捉污染物浓度随海拔变化的连续性和空间依赖性,而现有功能型数据分析(FDA)框架缺乏对条件依赖结构的量化能力。Rita Fici团队在《Journal of the Royal Statistical Society Series C: Applied Statistics》发表的研究,通过功能性高斯图回归模型(fGGRM)填补了这一空白。
研究利用IAGOS(全球飞机观测系统)的75次航班数据,采集了CO、O3、NO、H2O和温度的垂直剖面(<13,000米)。通过惩罚样条平滑处理离散观测值后,采用部分可分离的Karhunen-Loève(K-L)展开将多元功能数据转化为独立得分向量,构建了联合条件图套索估计器(jglasso),并创新性提出联合Kullback-Leibler交叉验证(jKLCV)准则优化模型选择。
数据预处理:对IAGOS的4秒分辨率原始数据进行惩罚样条平滑,消除测量误差;
基函数展开:通过部分可分离假设下的K-L展开,将功能数据转化为独立得分向量;
双重惩罚估计:采用组套索惩罚同时优化回归系数矩阵Bl和精度矩阵Θlγ;
模型选择:对比AIC、eBIC与新型jKLCV准则的性能。
在N=50的模拟中,fGGRM的AUC(曲线下面积)达0.92,显著优于Zapata等的方法(AUC=0.76)。即使协方差算子部分可分离性假设被违反(c=0.1),fGGRM仍保持稳健性。
网络结构:jKLCV选择的最优模型显示,H2O与温度存在强定向关联(βH2O最大值0.00025),而CO-O3的未定向连接印证了前者作为臭氧前体的作用。

垂直模式:温度对H2O的影响在8,000米以下呈现对角线主导,反映对流层底部的热力驱动;而上部平滑区域暗示高层大气的下行控制。
该研究首次将条件高斯图模型扩展至部分可分离功能数据,其双重惩罚框架可同步推断变量间条件独立性和功能回归关系。jKLCV准则在N=10的小样本中KL损失(35.55)显著低于AIC(54.78),为高维功能数据模型选择提供新标准。实际应用中,发现H2O在污染物传输中的枢纽作用,而CO-O3连接的稀疏化验证了化学机制的间接性。这些成果为大气化学建模和环境污染政策制定提供了量化工具。
生物通微信公众号
知名企业招聘