图神经网络的可解释性用于评估全球变化驱动因素对生态网络的影响

《Ecological Modelling》:Interpretability of graph neural networks to assess effects of global change drivers on ecological networks

【字体: 时间:2026年01月13日 来源:Ecological Modelling 3.2

编辑推荐:

  植物-传粉者网络中环境因子对连接性的影响分析,基于图神经网络(GNN)的可解释方法及Spipoll数据集,通过模拟和真实数据验证,发现土地利用显著影响网络连接性,采样偏差会部分改变效应估计。

  
埃姆雷·阿纳科克(Emre Anakok)|皮埃尔·巴比尔隆(Pierre Barbillon)|科林·丰坦(Colin Fontaine)|伊丽莎·泰博(Elisa Thebault)
巴黎萨克雷大学(Université Paris-Saclay)、巴黎萨克雷农业巴黎理工学院(AgroParisTech)、法国国家农业食品与环境研究院(INRAE)、UMR MIA Paris-Saclay,地址:法国帕莱索(Palaiseau)农学广场22号,邮编91120

摘要

传粉者在植物繁殖中起着关键作用,无论是在自然生态系统中还是在人类改造的景观中。全球变化因素,包括气候变化或土地利用变化,都可能改变植物与传粉者之间的相互作用。为了评估全球变化因素对传粉的潜在影响,需要大规模的互动数据、气候数据和土地利用数据。虽然最近的机器学习方法(如图神经网络(GNNs)能够分析这些数据集,但解释其结果可能具有挑战性。我们探讨了现有的方法来解读GNNs,以揭示各种环境协变量对传粉网络连通性的影响。通过一项广泛的模拟研究,我们验证了这些方法是否能够检测到协变量与植物属之间的交互作用,以及去偏技术是否会影响这些效应的估计。在Spipoll数据集上的应用表明,考虑或不考虑抽样效应会对网络连通性的估计产生影响。

引言

传粉者受到人类对环境影响的压力,例如气候变暖和土地利用变化,多项研究已经报告了它们的数量下降(Bartomeus等人,2018年;Imperatriz-Fonseca等人,2016年)。
可以使用二分网络(Ings等人,2009年)来研究植物与传粉者之间的相互作用,其中节点代表植物和传粉者分类单元,边表示观察到的互动。
分析植物-传粉者互动网络的结构有助于理解传粉者如何应对人类压力。研究表明,土地利用对传粉者的组成、数量和网络结构有显著影响。具体来说,与城市用地相比,农业用地可能增加传粉者的通用性和对灭绝情景的抵抗力(Deguines等人,2012年;Redhead等人,2018年)。然而,农业集约化可能是野生传粉者物种减少的主要原因(Duchenne等人,2020年)。与农业用地相比,城市环境通常与较低的传粉者生物多样性相关,但传粉者的数量会因特定的城市用地类型(如花园、菜园、公园或人造表面)以及存在的花卉类型而显著不同(Baldock等人,2019年;Rollings和Goulson,2019年)。至于气候变暖,它与传粉者的平均飞行日期提前有关(Duchenne等人,2019年),并且可能对某些蜜蜂物种有利(Duchenne等人,2020年)。
需要大规模的互动数据来评估土地利用和气候条件对生态网络的潜在影响。有两种方法可以用来研究这种影响。首先,可以比较不同条件或环境下的不同网络。这种方法可以提供关于季节(Fisogni等人,2022年)、城市化(Fisogni等人,2022年;Doré等人,2021年)或海拔(Lara-Romero等人,2019年)对生态网络影响的有趣结果。另一种方法是将来自多种条件的数据聚合到一个统一的网络中。利用在不同条件下观察到的物种共现情况来构建多个网络,并从统一网络中推断出连接关系。这种方法揭示了农业用地与传粉者的通用性和对灭绝的抵抗力之间的相关性(Redhead等人,2018年),或者土地利用与食物网结构之间的相关性(Botella等人,2024年)。
通过公民科学项目,特别是法国的Spipoll项目(Deguines等人,2012年),大规模互动数据的积累得到了促进,该项目自2010年以来一直在监测法国大都市区的植物-传粉者互动。参与者被要求在20分钟的观察期间拍摄访问自由选择的开花植物的传粉者的照片,然后上传照片并在指定的网站上识别昆虫。每次观察记录了在特定时间和地点观察到的昆虫种类。通过大约50万次植物-传粉者互动记录,可以从欧洲哥白尼气候数据集(Cornes等人,2018年)中提取相应的气候条件,以及从Corine土地覆盖(CLC,CLMS,2018年)中获取观察地点周围1000米半径内的相应土地利用比例(共44个类别)。
然而,由于观察者的增加和相关的观察者效应(Jiguet,2009年;Bird等人,2014年;Kelling等人,2015年;Johnston等人,2018年),公民科学项目容易受到抽样偏差的影响。对于Spipoll数据集,由于用户之间的差异(Deguines等人,2016年)以及每个用户经验的积累(Deguines等人,2018年),也观察到了抽样偏差。
大量的互动数据,连同气候和土地利用数据,可以使用机器学习领域的最新发展(如图神经网络(GNNs)进行联合分析,这些方法也可以考虑抽样偏差(Anakok等人,2024年)。GNNs在各种网络人工智能任务中表现出改进的性能,并且越来越受欢迎。然而,像神经网络一样,GNNs往往作为“黑箱”运行,尽管预测准确率高,但其输出难以解释。为了在生态学中推广这些方法,需要提高其可解释性(Cipriano等人,2025年)。已经开发了解释神经网络的方法(Zhang等人,2021年;Fan等人,2021年)。这些方法已应用于生态学领域(Scrinzi等人,2007年),用于更新森林清单。图神经网络特别需要针对图数据的离散性质进行特殊调整(Liu等人,2022年;Yuan等人,2022年;Khan和Mobaraki,2023年)。
在没有真实数据的情况下,可以依赖模拟来验证方法论方法的有效性,因为一些行为预计可以通过这些GNN可解释性方法捕捉到。特别是,它们应该能够检测到:(i)植物和传粉者之间的优先关系,(ii)环境协变量的影响(无论是正面还是负面),以及(iii)协变量与植物和/或传粉者身份之间的潜在交互效应,即一个协变量如何不同地影响两个植物-传粉者对的互动概率。
本文首先回顾了解读GNNs的方法。然后描述了将在本研究中使用的GNN架构和可解释性方法。接下来进行了一项模拟研究,以评估这些方法识别重要变量并确定它们对网络连通性贡献的符号的能力。模拟研究分为两部分,第一部分涉及简单的模拟图,第二部分复制了Spipoll协议的抽样过程。最后,将这些方法应用于Spipoll数据集,以确定哪些变量影响网络连通性。

部分摘录

GNNs的可解释性

在下文中,我们回顾了GNNs可解释性的最新发展。由于我们将使用一种能够处理抽样效应的特定GNN架构(在下一节中定义),因此主要讨论事后可解释性方法。这些方法适用于训练后的GNN解释,构成了当前大多数解释技术(Liu等人,2022年)。尽管这不是本文的重点,但仍值得提及一些示例

Spipoll数据集的二分VGAE适应

我们回顾了Anakok等人(2024年)提出的形式主义,将变分图自编码器(VGAE,Kipf和Welling,2016年)应用于Spipoll数据集所需的二分情况。

模拟研究

这项模拟研究分为两个主要部分。第一部分是在模拟的二分网络上进行的。第二部分旨在数值上模拟Spipoll的抽样过程。两部分都包含一系列逐渐增加复杂性的模拟。在描述了模拟设置后,结果以表格和图形的形式呈现。虽然这项工作只展示了部分模拟,但完整的模拟集可以在GitHub上获取://github.com/AnakokEmre/graph_features_importance

设置

我们考虑了2010年至2020年法国大都市区Spipoll数据集的观察期。总共有n1=26267次观察会话,其中观察到了n2=306种昆虫和u个植物属。观察会话-昆虫矩阵共报告了203,244次互动,而植物-昆虫矩阵B有13,127次不同的互动。BVGAE及其公平对应版本都在该数据集上进行了训练,其中D+=D=6。对于公平-BVGAE,我们定义了

结论

在这项工作中,我们探讨了GNNs的可解释性方法,通过广泛的模拟研究来评估节点特征对网络连通性的影响,其中模拟了数据采集过程。可以有效地检测到仅具有单一效应的特征,并估计其符号。然而,如果效应取决于节点组(例如植物属),那么所有提出的方法可能难以确定效应的符号及其大小。然后,我们评估了

CRediT作者贡献声明

埃姆雷·阿纳科克(Emre Anakok):撰写——原始草稿、方法论、形式分析、数据管理、概念化。皮埃尔·巴比尔隆(Pierre Barbillon):撰写——原始草稿、监督。科林·丰坦(Colin Fontaine):撰写——原始草稿、监督。伊丽莎·泰博(Elisa Thebault):撰写——原始草稿、监督。

写作过程中生成式AI和AI辅助技术的声明

在准备这项工作时,作者使用了ChatGPT来提高英语的流畅性。使用该工具后,作者根据需要审查和编辑了内容,并对发表文章的内容负全责。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

这项工作部分得到了法国国家研究机构(ANR)的资助(项目EcoNet,资助编号:ANR-18-CE02-0010-01)。

资金支持

埃姆雷·阿纳科克由INRAE的MathNum部门资助。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号