《Environmental Modelling & Software》:AI-driven knowledge synthesis for food web parameterisation
编辑推荐:
SPELL框架利用大语言模型自动整合全球生物多样性数据库、物种交互仓储及本地知识,实现海洋生态系统物种功能分组和食性矩阵合成。在澳大利亚四个海域验证中,物种分组重演率达99.7%,食性关联一致性51%-59%,与专家构建的Great Australian Bight网络匹配度82%。该工具有效缓解传统生态建模数据整合与分类耗时问题,但底栖生物、寄生虫等复杂类群仍需专家审核。
斯科特·斯皮利亚斯(Scott Spillias)| 伊丽莎白·A·富尔顿(Elizabeth A. Fulton)| 法比奥·博谢蒂(Fabio Boschetti)| 凯西·布尔曼(Cathy Bulman)| 乔安娜·斯特泽莱茨基(Joanna Strzelecki)| 罗文·特雷比尔科(Rowan Trebilco)
CSIRO环境部门,澳大利亚霍巴特
摘要
我们提出了一个概念验证框架“使用大型语言模型(LLMs)合成生态系统建模参数(SPELL)”,该框架自动化了物种分组和饮食矩阵的生成,从而加速了生态系统模型的构建过程。SPELL通过整合全球生物多样性数据库(如FishBase、GLOBI)、物种相互作用库以及可选的本地知识(利用大型语言模型LLMs),实现了物种分类和营养级相互作用的合成。我们通过澳大利亚四个地区的海洋案例研究验证了这一方法的有效性,结果显示物种分组的高度可重复性达到了99.7%,营养级相互作用的一致性为51%至59%。与专家制定的大澳大利亚湾食物网模型相比,该方法在生态准确性方面表现良好但仍有不足:92.6%的物种分组至少部分正确,82%的营养级联系被识别出来。然而,底栖生物、寄生虫以及具有多样化摄食策略的类群仍属于难以处理的挑战对象。这些发现强调了专家审核对于提高模型精细度的重要性,并表明SPELL是一个可用于快速原型化海洋及非海洋生态系统营养结构的通用工具。
引言
生态系统建模是理解和管理复杂环境的重要工具,其中食物网模型对于描绘海洋生态系统中的营养级相互作用和能量流动以及预测它们对外部压力的响应至关重要(Christensen和Walters,2004;Colléter等人,2015;Audzijonyte等人,2019)。这些模型为研究生态系统结构和功能提供了定量见解,使研究人员能够评估多重压力因素的累积影响,并支持基于生态系统的管理决策(Coll等人,2015;Villasante等人,2016;Geary等人,2020)。然而,构建这些模型面临着重大挑战,尤其是在描绘生态系统内复杂的营养级相互作用网络方面。
传统的食物网构建方法严重依赖大量的文献回顾、数据整理和专家知识,这些过程耗时且资源密集(Holden等人,2024a)。尤其是饮食矩阵的组装工作非常具有挑战性,需要整合来自野外研究、文献回顾和专家意见的多种数据来源。这在生态系统模型开发中形成了一个显著的瓶颈,尤其是在将模型应用于新的地理环境时(Holden等人,2024b)。人工智能(AI)的最新进展为简化食物网构建过程提供了新的机会,有助于避免这些瓶颈(Spillias等人,2024b)。AI工具在知识/证据合成(Spillias等人,2024c;Keck等人,2025;Castro等人,2024;Spillias等人,2024a;Zheng等人,2023;Nugraha等人,2024)、生态与环境任务(Fernandes和D’Mello,2024;Li等人,2024;Chen和Xu,2024;Dorm等人,2025;Noleto Filho等人,2024)以及建模任务(Lapeyrolerie等人,2022;Tuia等人,2022;Karniadakis等人,2021)方面取得了成功,但其应用于基于过程的生态系统建模仍处于初级阶段。关键挑战在于确保AI驱动的方法能够在保持生态有效性的同时有效整合可用信息。
我们提出了“使用大型语言模型(LLMs)合成生态系统建模参数(SPELL)”这一新颖而灵活的框架,它利用用户定义的在线资源来利用大型语言模型(LLMs)构建食物网。该方法整合了多种数据来源,包括全球生物多样性数据库、物种相互作用库以及本地持有的非结构化或结构化文本,以自动化食物网开发的关键步骤。SPELL利用用户选择的LLMs将物种分组到功能单元,并估算营养级相互作用的强度。我们在澳大利亚四个不同的海洋生态系统——北澳大利亚、东南大陆架、东南近海和大澳大利亚湾地区评估了该系统的可重复性,并在大澳大利亚湾地区评估了其准确性。具体而言,我们测试了自动化物种分组决策的精确度(重复性)和科学准确性,以及生成的食物矩阵比例的精确度和准确性,其中准确性是根据与专家估计的相似程度来定义的。这些地区具有不同的环境条件、物种组合和生态动态,为测试SPELL的适应性和可靠性提供了有力依据。
章节片段
SPELL概述
构建食物网模型需要大量时间来将物种分类到功能单元并确定它们的营养级相互作用。SPELL通过一个五阶段流程自动化了这些任务,该流程将人工智能与生态数据库相结合(图1)。
流程的第一步是定义模型领域,然后使用生成的shapefile从海洋生物多样性信息系统(OBIS)中提取完整的物种列表(Grassle和Stocks,1999)。
结果
我们的验证框架评估了AI辅助生态系统建模方法的三个关键方面:物种分组的可重复性、食物网构建的一致性以及与专家制定矩阵的准确性。
讨论
我们已经证明,SPELL能够以相当高的可靠性构建生态系统模型的食物网。这一能力解决了生态系统建模中的一个重要挑战,因为随着这些模型在环境管理和政策决策中应用的日益增多,高效准确的开发方法变得至关重要(Weiskopf等人,2022;Schuwirth等人,2019)。传统上构建可靠的生态系统模型涉及复杂的技术挑战,包括物种分类等。
CRediT作者贡献声明
斯科特·斯皮利亚斯(Scott Spillias):撰写——审阅与编辑、初稿撰写、可视化、验证、软件开发、项目管理、方法论设计、数据整理、概念化。伊丽莎白·A·富尔顿(Elizabeth A. Fulton):撰写——审阅与编辑、验证、监督、资源协调、方法论设计、数据整理、形式分析。法比奥·博谢蒂(Fabio Boschetti):撰写——审阅与编辑、监督、方法论设计、数据整理、形式分析。凯西·布尔曼(Cathy Bulman):撰写——审阅与编辑、验证
关于生成式AI的使用声明
在准备本手稿时,使用了生成式AI工具(特别是Claude Sonnet 3.5)来协助语言润色、文本结构和总结等工作。所有科学内容、数据解释和结论均由作者独立开发并验证,以确保准确性和完整性。
利益冲突声明
作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。
致谢
斯科特·斯皮利亚斯(Scott Spillias)获得了CSIRO的R+博士后奖学金资助。该项目部分由“未来海鲜”(Futures of Seafood)项目资助。