
-
生物通官微
陪你抓住生命科技
跳动的脉搏
CAMELIA:整合结构与功能指数提升物种组合预测——以法国阿尔卑斯山植物群落为例
【字体: 大 中 小 】 时间:2025年09月25日 来源:Methods in Ecology and Evolution 6.2
编辑推荐:
本刊推荐:本研究创新性地提出了CAMELIA(Community Assemblage Modelling macroEcoLogically Informed with AI)神经网络框架,通过整合物种分布模型(SDM)与群落水平指数(如物种丰富度SR、群落平均值CM和群落标准差CSTD),显著提升了植物群落组合预测的准确性。该框架在法国阿尔卑斯山植物群落案例中证实,即使使用低质量数据(如MEM预测或噪声观测值),仍能保持优于传统堆叠物种分布模型(S-SDM)的性能(如植物高度CM的R2达0.98),为生物多样性建模提供了灵活有效的解决方案。
研究背景与挑战
生物多样性预测是生态学研究的核心挑战,涉及物种分布、群落结构和生态系统功能的多维度整合。物种分布模型(SDM)虽能预测单个物种的环境响应,但难以重构真实群落;宏生态模型(MEM)可直接预测群落指数(如物种丰富度),却缺乏物种级分辨率。传统堆叠物种分布模型(S-SDM)存在物种丰富度高估、功能多样性预测不准等问题,亟需开发新方法突破局限性。
CAMELIA框架的设计理念
CAMELIA(Community Assemblage Modelling macroEcoLogically Informed with AI)通过多任务神经网络联合优化物种出现概率与群落指数,将SDM输出与群落约束(如功能性状的群落平均值CM和标准差CSTD)深度融合。其核心创新在于:
输入层整合物种概率(来自S-SDM或jSDM)、群落指数(观测或MEM预测值)及物种特异性状(如植物高度、比叶面积);
网络结构采用全连接层,通过可微分损失函数(二进制交叉熵和均方对数误差)同步优化物种与群落级预测;
支持灵活权重调整(如损失函数中λspecies与λcommunity的平衡),适应不同研究目标。
案例研究:阿尔卑斯山植物群落
研究选取法国阿尔卑斯山4463个草地群落样点、831种植物,涵盖植物高度、比叶面积和叶片氮含量等性状。通过四折交叉验证对比:
CAMELIA-OBS(输入观测群落指数)显著提升所有指标:物种丰富度误差降低38%,S?rensen相似系数平均提高33%,植物高度CM的R2达0.98(S-SDM仅为0.74);
CAMELIA-MEM(输入MEM预测指数)在群落标准差(CSTD)预测上优于S-SDM(R2提升6.9%),但物种级精度略有下降(AUC从0.87降至0.86);
CAMELIA-PROXY(输入含30%噪声的指数)仍保持稳健性,R2介于OBS与MEM之间(如植物高度CM为0.92)。
二值化策略与生态意义
概率输出(pCAMELIA)可通过两种方式转换为二进制群落:
物种特异性TSS阈值二值化(bCAMELIA):降低物种丰富度高估(bS-SDM预测为实测7.5倍,bCAMELIA-MEM降至5.4倍),但物种级TSS略低于S-SDM(0.52 vs. 0.58);
概率排序规则(PRR)二值化:按MEM预测丰富度截断物种列表,虽改善群落组成匹配度,但物种级TSS显著降低(0.11–0.20)。
结果表明,CAMELIA在维持功能指数准确性(如CSTD误差降低)的同时,有效缓解了S-SDM的富集偏差。
应用前景与局限性
CAMELIA的灵活性体现在:
支持多源数据输入(野外观测、MEM输出、遥感衍生指数);
可扩展至其他群落指标(如系统发育多样性);
适用于不同空间尺度(需确保群落指数可微分计算)。
局限在于:
依赖群落-环境平衡假设,未显式考虑扩散过程;
输入数据质量直接影响输出精度(如MEM预测不准时改善有限);
未来需结合迁移模型(如MigClim)增强动态预测能力。
结论
CAMELIA为群落组合预测提供了兼顾物种分布与宏观生态约束的通用框架,其神经网络架构能够融合多维度生态信息,生成更符合生态学现实的物种组合。该方法在保护规划、生态系统服务评估及全球变化生物学中具有广泛应用潜力。
生物通微信公众号
知名企业招聘