
-
生物通官微
陪你抓住生命科技
跳动的脉搏
因果约束机器学习框架提升生态系统呼吸(TER)估算的可靠性与时空泛化能力
【字体: 大 中 小 】 时间:2025年07月03日 来源:Agricultural and Forest Meteorology 5.6
编辑推荐:
针对陆地生态系统呼吸(TER)估算模型跨区域泛化能力不足的问题,研究人员创新性地将XGBoost机器学习与PCMCI因果推断技术结合,构建因果约束框架。该框架虽仅小幅提升估算精度(ΔrMAE≈3~5%),但显著优化了模型生态机制,使常绿阔叶林、稀树草原等生态系统的外推任务误差降至14%,揭示了植被结构参数(如聚集指数、非光合植被覆盖)对TER的负向影响,为碳循环模型开发提供新范式。
在全球碳循环研究中,陆地生态系统呼吸(TER)作为二氧化碳排放的关键过程,其精确估算直接影响气候变化预测和碳中和政策制定。然而,现有TER模型面临两大困境:传统温度敏感性框架(如Q10模型)难以捕捉不同生物群落间的呼吸机制差异,而纯数据驱动的机器学习模型虽精度较高,却因观测站点分布不均导致外推结果不可靠。这种"精度与泛化不可兼得"的现状,严重制约了全球碳通量评估的可靠性。
为解决这一难题,中国科学院的研究团队在《Agricultural and Forest Meteorology》发表创新成果,首次将因果推断技术PCMCI(Peter-Clark Momentary Conditional Independence)与XGBoost算法融合,开发出因果约束的TER估算框架。该研究基于FLUXNET 2015数据集,通过PCMCI量化了空气温度、植被结构参数等21个变量对TER的因果效应,并以此重构XGBoost的损失函数。结果显示,该框架不仅使常绿阔叶林(EBF)等生态系统的外推误差降至14%,更揭示了聚集指数(clumping index)和非光合植被覆盖对TER的负向调控作用——这一发现挑战了传统温度主导范式,为日间呼吸抑制机制研究开辟新方向。
关键技术方法包括:1) 基于FLUXNET 2015的全球通量塔数据构建多PFTs样本集;2) 采用PCMCI+算法解析TER驱动因子的因果网络;3) 开发因果权重约束模块嵌入XGBoost训练流程;4) 通过SHAP值分析和时空外推验证模型机制合理性。
【因果关系解析】PCMCI定量识别出空气温度在寒带森林(ENF、DBF)中的主导作用(因果效应>0.4),而在热带草原则发现降水与LAI(叶面积指数)的协同调控,证实了植被结构参数在TER时空变异中的普适性贡献。
【模型性能验证】因果约束模型在训练集上仅小幅提升精度(rMAE降低3-5%),但在外推测试中表现突出:EBF和稀树草原站点误差较传统模型降低28%,且特征重要性排序与生态理论高度一致。
【机制新发现】温度敏感性分析揭示TER-Q10呈单峰曲线,而聚集指数在落叶阔叶林(DBF)中的贡献度达19%,暗示冠层结构通过光调控影响呼吸底物供应。这些发现推动了对"植被结构-呼吸过程"耦合机制的认识。
该研究的突破性在于首次实现TER估算模型"数据驱动"与"机制约束"的有机统一。通过将PCMCI识别的因果拓扑转化为机器学习模型的先验知识,既保留了XGBoost处理非线性关系的优势,又规避了"相关非因果"的建模陷阱。特别值得注意的是,研究提出的框架具有普适性——其因果约束模块可迁移至其他生态过程建模,为地球系统模型参数化提供新思路。正如作者Cenliang Zhao在讨论中指出,未来若能将白昼呼吸抑制参数纳入模型,有望进一步破解热带森林碳通量的"正午凹陷"之谜。这项成果不仅为TER估算树立新标准,更启示学界:在环境建模中,因果关系的正确性可能比单纯精度提升更具科学价值。
生物通微信公众号
知名企业招聘