一种新颖的鲁棒专家混合模型,该模型结合了因果先验,可用于可解释的水质诊断

《ADVANCED ENGINEERING INFORMATICS》:A novel robust mixture-of-experts model with causal priors for interpretable water quality diagnosis

【字体: 时间:2025年12月31日 来源:ADVANCED ENGINEERING INFORMATICS 9.9

编辑推荐:

  水质评估中传统模型依赖统计相关性导致可解释性差且脆弱,本研究提出Causal MoE框架,将Nonlinear NOTEARS算法发现的因果图嵌入混合专家模型,每个专家独立建模子系统以增强机制解释性,同时通过因果专家调制模块和Drop-Expert正则化策略提升鲁棒性。跨中国、美国、加拿大、英国的多源数据验证显示分类准确率超96%,专家移除后仍保持93%以上性能,优于TabKANet和LightGBM等基线,并揭示各国污染机制差异。

  
王梦豪|杨亚峰|李发文|刘琳|曹文梅
华北科技大学人工智能学院,中国唐山063210

摘要

水质的恶化,加上工业活动和气候压力的影响,使得有效的环境监测和决策变得复杂化。尽管传统的数据驱动模型具有预测价值,但它们通常作为不透明的系统运行,更重视统计相关性而非物理因果关系,这使得它们容易受到分布变化的影响。为了克服这些限制,本研究提出了“因果专家混合”(Causal Mixture-of-Experts)框架,该框架将因果结构发现直接嵌入到模块化的深度学习架构中。通过使用非线性NOTEARS算法从观测数据中推导出透明的因果先验,该框架严格限制了专家系统的行为。具体来说,每个专家都需要对不同的数据生成子系统进行建模,以确保机制的可解释性。同时,通过因果专家调节模块(Causal Expert Modulation Module)整合了父子依赖关系,并采用“丢弃专家”(Drop-Expert)正则化策略来动态补偿潜在的模块故障,从而增强了系统的鲁棒性。通过对来自中国、美国、加拿大和英国的跨国多源数据集进行严格评估,并与各种先进的基线模型进行比较,分类准确率超过了0.96。值得注意的是,即使在专家被移除的情况下,该模型的性能仍然保持在0.93以上,优于TabKANet和LightGBM等基线模型。除了预测精度之外,该框架还能通过识别不同的污染驱动因素(如中国的富营养化和加拿大的有机污染)来区分各种污染源。这种能力有效地弥合了算法建模与负责任的环境管理之间的差距。

引言

水质在维持全球生态系统和人类发展方面发挥着关键作用,支持公共卫生、粮食安全和生物多样性[1]、[2]。然而,快速的工业扩张、集约化的农业活动以及加速的气候变化共同加剧了地表水的污染,导致富营养化、有毒金属积累和生态系统不稳定[3]、[4]、[5]。这些日益严重的压力凸显了迫切需要准确、鲁棒且可解释的水质评估模型,以支持环境科学中的监测、管理和基于证据的政策制定[6]、[7]。
与此同时,传感器网络的广泛部署以及大量长期环境记录的积累,加速了向数据驱动建模框架的转变。在这一背景下,最先进的机器学习和深度学习架构在水生生态系统的复杂和动态环境中始终表现出显著的预测性能[8]、[9]。然而,正是这种复杂性也带来了一个关键的限制:大多数先进的水质模型本质上是不透明的,主要作为黑箱系统运行,更倾向于统计模式而非机制洞察[10]、[11]、[12]。在环境管理中,识别因果驱动因素对于有针对性的干预至关重要[13]。这种对相关性的依赖而非因果关系的依赖造成了严重的不匹配。虽然这些模型在预测方面表现出色,但它们往往无法阐明污染物的来源或控制过程之间的相互作用[14]、[15]。因此,在需要透明决策支持和准确来源分配的高风险环境中,它们的价值有限[16]。或许最令人担忧的是它们的脆弱性:当面临分布变化或前所未见的情况时,基于相关性的方法通常会表现出较差的泛化能力和鲁棒性,从而影响其在实际应用中的可靠性。
在这种背景下,出现了一个跨国、多源且经过严格基准测试的科学挑战:如何设计一个数据驱动的框架,使其能够在宏观层面上运作,适用于异构的区域系统,并提供对污染机制的诊断性洞察,而不仅仅依赖于局部的物理建模。在许多实际情况下,由于水文结构、监测强度和污染物类型的多样性,为每个单独的水体构建高保真的物理过程模型是不切实际的。相比之下,大规模跨国观测数据集的迅速增长为从异构且部分非结构化的监测记录中提取可推广的因果模式提供了前所未有的机会[17]。这激发了需要一种既能利用跨区域数据丰富性又能产生可解释的、基于因果关系的诊断结果的模式的需求[18]。
在这个背景下,本研究试图解决一个核心方法论问题:如何将数据衍生的因果结构系统地嵌入到专家混合架构中,以实现与机制对齐的专家分解,在异构和非平稳条件下增强鲁棒性,并提供不同国家水污染路径的可解释诊断。解决这个问题需要以尊重环境过程的父子依赖关系的方式,同时减轻基于相关性的专家路由所固有的脆弱性。
为了解决这些持续存在的限制,本研究提出了三项关键的方法论贡献,显著扩展了之前的工作。首先,将数据驱动的因果图无缝集成到专家混合框架中,使专家路由受到潜在机制的指导,而不仅仅是统计相关性。其次,引入了专门的因果专家调节机制,以强化父子依赖关系,并提高单个专家的鲁棒性。第三,开发了一个连贯的跨国因果解释框架,并通过与其他先进基线的严格比较评估进行了验证,揭示了中国、加拿大、美国和英国之间不同的污染路径。

部分摘录

水质诊断模型

近几十年来,水质评估经历了深刻的变革。20世纪中叶的做法主要依赖于劳动密集型的手动采样和基于实验室的物理化学分析[19]、[20],而现代方法则侧重于连续自动化的传感器网络和复杂的数据驱动建模框架。这一转变极大地提高了监测的分辨率和时间覆盖范围,奠定了可靠的观测基础

数据描述和研究范围

这个数据集由Karim等人[44]精心整理,综合了多个区域和全球水质数据库,并补充了来自各种水资源管理机构的监测记录。编译过程包括严格的质量保证和标准化协议,以确保数据的完整性和可比性。该数据集涵盖了1940年至2023年的数据,包含大约282万个独立测量值,涉及八个

提出的因果专家混合框架

模型开发首先从识别因果关系开始,使用非线性NOTEARS算法来阐明区域水质数据集中的潜在因果结构。随后,基于推断出的因果图构建了一个专家混合框架。在这个框架中,每个专家单元都针对不同的数据生成子系统进行定制,从而实现对复杂环境过程的结构化和可解释的表示。

数据驱动的因果发现揭示了关键的功能子系统

在应用非线性NOTEARS算法之前,明确阐述支持有效因果发现的理论假设是必要的。该框架基于因果充分性原则运行,要求所有影响系统的相关变量都被观察到并纳入数据集,从而排除了可能同时影响多个观测变量的未测量混杂因素。该方法还假设不存在反馈循环

因果驱动的架构和模型鲁棒性

本研究的主要贡献在于超越了传统的基于相关性的建模方法,开发了一个基于因果结构的创新框架。具体来说,通过使用非线性NOTEARS算法,我们从观测数据中推断出一个有向无环图(DAG),从而揭示了水质变量之间的复杂非线性因果关系[59]。这个因果图有两个关键作用:它代表了因果发现的结果,同时提供了结构化的

局限性

尽管这项研究证实了鲁棒因果专家混合(Robust Causal MoE)框架的鲁棒性和可解释性,但仍存在某些局限性。值得注意的是,复杂的模块化架构加上专家之间的动态交互显著增加了模型的计算需求,从而对硬件基础设施提出了更高的要求。此外,专家调节机制的有效性也受到限制。实证评估显示,在某些情况下性能会急剧下降

结论和未来工作

本研究旨在开发一个建模框架,将数据衍生的因果先验直接嵌入到水质评估的诊断过程中。为此,我们引入了因果专家混合(Causal MoE)架构,将因果结构发现整合到模型中,使变量之间的依赖关系更准确地反映潜在的数据生成机制,而不是不稳定的相关模式。
这种设计带来了几个关键优势。使专家

CRediT作者贡献声明

王梦豪:撰写——原始草稿,验证,软件,方法论。杨亚峰:撰写——审稿与编辑,监督,概念化。李发文:监督,资源获取,资金筹集。刘琳:可视化,调查,数据整理。曹文梅:验证,软件。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

作者感谢中国国家重点研发计划(2023YFC3006601)、国家自然科学基金(52279005)以及省级高校基本科研业务费(JJC2024072)的支持。

代码可用性声明

支持本研究发现的完整代码可向相应作者请求获得。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号