基于多变量高斯过程回归的方法,用于从有限且非共址的测量数据中表征地理数据的空间变异性

《Engineering Geology》:Multivariate Gaussian process regression for characterization of geo-data spatial variability from limited and non-co-located measurements

【字体: 时间:2026年02月11日 来源:Engineering Geology 8.4

编辑推荐:

  地理数据空间变异性分析中,多源非共位测量常因时间和技术限制导致数据稀疏,传统MGPR依赖协方差函数构建但存在样本需求高、共位性强等问题。本研究提出数据驱动型MGPR,通过正交基函数稀疏分解协方差矩阵,无需预设隐变量数量及形式,有效融合有限非共位测量,结合模拟与真实数据验证其捕捉空间自相关及跨变量相关的能力,并实现合理的不确定性量化。

  
孔淼|王宇
中国香港九龙清水湾香港科技大学土木与环境工程系,沿海城市气候韧性国家重点实验室

摘要

由于时间、预算和技术的实际限制,空间变化的地理数据通常只在有限的几个地点进行稀疏测量。因此,从有限的测量数据中准确描述地理数据的空间变异性仍然具有挑战性。另一方面,实际中的地理数据通常来自多次测试或不同的来源,这些数据通常表现出相关性。可以使用数据融合方法(如多元高斯过程回归(MGPR)来整合这些相关联的多变量测量数据,从而有效利用它们的互补信息。然而,现有MGPR的性能在很大程度上取决于有效多元协方差函数的构建,而这通常需要大量且位置一致的多元测量数据。相比之下,由于使用了破坏性测试,多元测量数据通常是有限的且非共位的,这给应用现有MGPR来描述地理数据的空间变异性带来了挑战。本研究提出了一种新的MGPR方法,可以有效地融合有限且非共位的多元测量数据,以联合预测多个地理数据剖面的空间变化。该方法不是通过构建有效的多元协方差函数,而是利用有限数量的正交基函数以数据驱动的方式表示不同类型地理数据的空间相关结构。模拟数据和真实数据示例表明,所提出的MGPR能够基于有限且非共位的多元测量数据有效地捕捉地理数据之间的自相关和互相关,并共同预测多个地理数据剖面,同时量化不确定性。

引言

准确描述地理数据的空间变异性在可靠的风险评估、明智的决策以及各种地理学科中的数字孪生体开发中起着关键作用(例如,Breunig和Zlatanova,2011;Varouchakis等人,2019;Wang等人,2022)。然而,由于时间、预算和技术的限制,空间变化的地理数据通常只在有限的几个地点进行稀疏测量,这仍然是一个挑战(例如,Wang等人,2017;Gong等人,2021)。实际上,地理数据通常来自多个来源,包括不同的现场和实验室测试(例如,D'Ignazio等人,2016;Ching等人,2016;Phoon等人,2019)。这些多变量数据通常表现出相关性,这有助于它们之间的互补(例如,Xu等人,2021;Phoon等人,2022;Wang等人,2025)。因此,通过数据融合方法共享这些相关联的多变量测量数据中的互补信息,对于描述地理数据的空间变异性是有益且实用的。
多元高斯过程回归(MGPR),也称为多元克里金法(例如,Haas,1996)或协作克里金法(Ver Hoef和Barry,1998),是一种广泛使用的数据融合方法,它可以同时考虑变量之间的自相关和互相关,并在预测点量化预测不确定性(例如,Liu等人,2018a;Wolff等人,2021)。MGPR的性能在很大程度上取决于从多源测量数据中正确构建有效的多元协方差函数(例如,Goovaerts,1997;Gringarten和Deutsch,2001;Liu等人,2018b)。文献中提出了各种模型来开发有效的协方差函数(例如,Journel和Huijbregts,1978;Goovaerts,1997;Wackernagel,2003;álvarez和Lawrence,2008;álvarez等人,2012;Hori等人,2016)。其中,基于共区域化的线性模型(LMC)因其灵活性和可解释性而在MGPR中得到广泛应用(例如,Journel和Huijbregts,1978)。在基于LMC的MGPR中,每个地理数据剖面被建模为几个共享的潜在高斯过程的加权和,其中共区域化系数作为权重。通过结合由不同协方差函数控制的多个潜在过程,基于LMC的MGPR构建了一个复合的多元协方差结构,以同时描述多个变量之间的(平稳或非平稳的)自相关和(正或负的)互相关。
尽管具有这些优势,但在实际应用中,基于LMC的MGPR中潜在过程的最佳数量以及每个潜在过程的适当协方差函数往往是未知的,并且难以从多元测量数据中确定(例如,Goovaerts,1997;álvarez等人,2012;Fricker等人,2013;Liu等人,2018b;Zinas等人,2025)。即使可以正确确定潜在过程的数量和相关协方差函数,可靠估计基于LMC的MGPR的许多超参数(特别是不同协方差函数和共区域化系数的长度尺度)通常也需要大量的多元测量数据,并且这些数据需要具有规则和共位的采样结构(例如,Goovaerts,1997;Wackernagel,2003;Webster和Oliver,2007;Genton和Kleiber,2015;Liu等人,2018a),如图1(a)所示。然而,实际中的多元测量数据通常测量稀疏且采样间隔不规则,更具有挑战性的是,由于使用了破坏性测试,这些数据是非共位的(例如,Xu等人,2022;Guan等人,2024),如图1(b)所示。因此,使用基于LMC的MGPR来有效整合有限且非共位的多元测量数据以描述地理数据的空间变异性是具有挑战性的。
本研究旨在解决这一挑战,并开发一种新的MGPR方法,直接融合有限且非共位的多元测量数据,以联合预测具有量化不确定性的多个相关地理数据剖面。受到高斯过程回归中协方差函数稀疏谱表示思想(例如,Rahimi和Recht,2007;Lázaro-Gredilla等人,2010)或克里金法中低秩基函数近似的启发(例如,Cressie和Johannesson,2008),所提出的MGPR将多元协方差函数近似为有限组特征函数的加权和,相应的特征值作为权重。所提出的MGPR是数据驱动的,无需确定潜在过程的数量、为每个潜在过程选择协方差函数形式或估计相关超参数。为了有效利用来自有限且非共位多元测量数据的不同类型地理数据之间的自相关和互相关,所提出的MGPR进一步用显式已知的正交基函数替换了未知的特征函数。本研究的其余部分组织如下:第2节简要回顾了基于LMC的MGPR;第3节详细介绍了所提出的MGPR;第4节和第5节使用模拟数据和真实数据示例来演示和验证所提出的MGPR。

小节片段

多元高斯过程回归的简要回顾

本节简要回顾了基于LMC的MGPR,用于建模既相关又具有空间自相关的多个地理数据剖面,如图2所示。例如,随深度变化的地理数据剖面(例如,图2(a)中间的红色实线)可以用一个n×1向量f_i = [f_i(x_j)]^T表示,其中i = 1, 2, …, p和j = 1, 2, …, n,p是感兴趣的相关地理数据剖面的数量;f_i(x_j)是f_i中由深度x_j索引的第j个元素;

具有协方差矩阵分解的提出的MGPR

在本节中,开发了一种新的MGPR方法,可以直接从有限且非共位的多元测量数据中联合预测多个地理数据剖面。与基于LMC的MGPR中的方法不同(见图3),所提出的MGPR不是将多元协方差矩阵C_f组装为A_j和C_j的克罗内克积的加权和(如方程(4)所示),而是通过特征函数和特征值直接表示C_f。作为示例,图4展示了特征分解的示意图

模拟数据示例

在本节中,模拟了三个相关地理数据剖面来说明所提出的MGPR。这些剖面是根据图3(c)中的多元矩阵C_f使用矩阵分解生成的(例如,Yamazaki和Shinozuka,1990)。首先,基于C_f合成了三个具有相同尺度的剖面。为了模拟实际场景中相关剖面通常具有不同尺度的情况,随后根据平均值对这些合成剖面进行了重新缩放

真实数据示例

本节使用在芬兰Vihti的一个粘土现场收集的真实多元测量数据来说明所提出的MGPR在描述地理数据空间变性方面的实用性(D'Ignazio等人,2016)。这些测量数据包括现场叶片试验得到的不排水抗剪强度(suFV)、预固结压力(σp'" role="presentation">σp')、液限(LL)、塑限(PL)和天然含水量(w),如图16所示。它们之间的相关性已被广泛认可

总结与结论

本研究提出了一种新的多元高斯过程回归(MGPR)方法,可以使用有限且非共位的多元测量数据有效地捕捉不同类型地理数据之间的自相关和互相关,从而能够联合预测具有合理量化不确定性的多个地理数据剖面。所提出的MGPR利用截断的特征分解来稀疏近似多元协方差矩阵。

CRediT作者贡献声明

孔淼:撰写 – 审稿与编辑、撰写 – 原稿、可视化、验证、软件、方法论、调查、正式分析、数据整理、概念化。王宇:撰写 – 审稿与编辑、撰写 – 原稿、监督、项目管理、方法论、资金获取、概念化。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号