编辑推荐:
为精准估算森林环境中植物杀菌素(BVOCs)浓度,研究人员以台湾溪头自然教育区为对象,运用地理空间机器学习(含 RF、XGB 等算法)建模。结果显示 RF 和 XGB 分别解释 83.3% 和 98.4% 的时空变异,揭示其与气象、植被关联,为环境管理等提供新路径。
森林作为 “地球之肺”,不仅是生态系统的核心,其释放的生物活性物质对人类健康的影响也日益受到关注。植物杀菌素(Phytoncides)作为树木释放的一类生物挥发性有机化合物(BVOCs),具有抗菌、抗炎、抗氧化等多种生物活性,被证实能通过森林环境暴露增强人体免疫力。然而,传统研究对森林植物杀菌素的空间分布估算精度不足,且缺乏整合多源地理空间数据的分析框架。现有方法如回归模型误差较高(约 30%),或受限于单一植被类型和少量环境变量,难以全面揭示其时空变异规律。因此,如何精准量化植物杀菌素的环境浓度并解析其影响因素,成为环境科学与公共健康领域的重要挑战。
为填补这一研究空白,台湾大学实验森林(溪头自然教育区)的研究团队开展了一项创新性研究。该研究以 camphene 和 α-pinene 为代表性植物杀菌素,整合地理空间数据与机器学习算法,构建了高精度的时空估算模型。研究成果发表于《Ecological Indicators》,为森林资源管理和健康城市规划提供了关键科学依据。
研究采用的核心技术方法包括:①多源数据采集:同步收集植物杀菌素浓度实测数据(通过气相色谱 - 质谱联用技术(GC-MS)分析),以及气象因子(温度、湿度、太阳辐射等)、地形(海拔、坡度)、土地覆盖(植被类型、密度)和地标点(道路、科研站点)等地理空间数据;②机器学习建模:运用随机森林(RF)、梯度提升(GB)、极端梯度提升(XGB)和轻量梯度提升机(LGBM)四种算法,并结合可解释人工智能工具 SHapley Additive exPlanations(SHAP)筛选关键预测因子;③模型验证与空间映射:通过 10 折交叉验证、过拟合测试和分层分析评估模型性能,最终利用最优模型生成高分辨率浓度分布地图。
3.1 原位测量与模型性能
原位测量表明,研究区域内 camphene 日均浓度(0.98 ppb)显著高于 α-pinene(0.06 ppb),两者浓度波动与每日气象条件密切相关。模型评估显示,RF 模型对 camphene 的解释力达 83.3%(R2=0.833),XGB 模型对 α-pinene 的解释力高达 98.4%(R2=0.984),且过拟合值均低于 0.3,验证了模型的稳健性。SHAP 分析揭示,camphene 浓度主要受温度、湿度及日本柳杉(Cryptomeria japonica)和台湾杉(Taiwania cryptomerioides)分布的影响;α-pinene 则与植被密度、气象因子及科研站点周边植被多样性相关。
3.2 时空分布特征
空间分析显示,camphene 在研究区东部高海拔区域浓度较高,该区域植被类型丰富,以日本柳杉和台湾杉为主;西部以单一日本柳杉林为主,浓度较低。每日浓度波动与气象条件相关,如低温高湿环境易导致污染物滞留。α-pinene 分布相对均匀,但在 F05、I08 等站点的特定日期出现峰值,与日本柳杉的局部密集分布一致。三维地形叠加分析进一步证实,植被类型和微气候是影响空间异质性的关键因素。
4. 讨论与研究意义
本研究首次将地理空间机器学习框架应用于森林植物杀菌素的时空建模,突破了传统统计方法的局限性。与韩国等国的同类研究相比,该模型通过整合地形、土地覆盖等多维度数据,显著提升了预测精度(R2 提升 20%-30%)。研究发现,针叶树(尤其是日本柳杉)是 camphene 和 α-pinene 的主要来源,其释放量与植被密度呈正相关,而气象因子通过影响植物代谢和空气流通间接调控浓度分布。
研究结论为环境管理提供了双重启示:其一,通过优化城市绿地中的针叶树配置(如日本柳杉),可提升有益植物杀菌素的暴露水平;其二,高分辨率浓度地图可辅助识别 “森林健康热点”,指导生态旅游路线设计和公共健康干预。尽管研究局限于夏季单一场景,但其方法论可为全球森林生态效益评估提供通用框架。未来研究若扩展至全季节数据和多物种分析,将进一步深化对森林 - 健康关联的科学认知。