机器学习与地理空间分析预测波斯猫薄荷中荆芥内酯积累的精准农业应用

【字体: 时间:2025年08月28日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对药用植物Nepeta persica中关键活性成分nepetalactone的生物合成受环境因素影响机制不明的问题,通过整合机器学习算法(RF-SVM-GBM混合模型)与地理空间分析技术,揭示了海拔、坡向和年均温是调控荆芥内酯积累的关键环境因子。研究构建的栖息地适宜性模型预测精度较单模型提升21.1%,为伊朗Fars省高活性成分栽培区划提供科学依据,对药用植物资源可持续利用具有重要实践价值。

  

在干旱半干旱地区生长的波斯猫薄荷(Nepeta persica)因其富含具有药理活性的荆芥内酯(nepetalactone)而备受关注。这种单萜类化合物不仅展现出媲美合成驱虫剂DEET的效果,还能通过调节GABA能通路产生镇静作用,同时具有抗菌、抗炎和抗氧化等多重功效。然而,这种珍贵药用植物的次生代谢产物积累受到复杂环境因素的调控,传统栽培模式难以精准把控活性成分含量,导致资源利用效率低下。更严峻的是,气候变化正加剧其原生栖息地的生态压力,如何科学规划种植区域成为亟待解决的难题。

为破解这一难题,Emran Dastres团队在《Scientific Reports》发表研究,创新性地将三种机器学习算法(随机森林RF、支持向量机SVM、梯度提升机GBM)与地理信息系统(GIS)和遥感技术相结合,对伊朗Fars省62个采样点的环境参数与荆芥内酯含量进行建模分析。研究团队采用气相色谱(GC)和气质联用(GC-MS)精确测定活性成分,通过Sentinel-2卫星影像反演气候数据,结合阿拉斯加卫星地形数据,构建了包含18个环境变量的预测体系。

研究首先通过变量重要性分析揭示关键环境驱动因子。偏最小二乘回归(PLS)和广义线性模型(GLM)共同验证海拔是影响荆芥内酯积累的最强预测因子,其次是南向坡位和年均温度。这些地形气候特征通过调控光合效率、水分胁迫程度和紫外线暴露量,间接影响单萜类化合物的生物合成通路。土壤特性中,适中的有机质含量(3-5%)和微碱性(pH 7.5-8.2)环境最有利于活性成分积累。

在模型构建方面,研究团队开发的RF-SVM-GBM混合集成模型表现出卓越的预测性能。相较于单一算法,该模型将均方根误差(RMSE)降低21.1%至0.015,确定系数(R2)提升至0.82。这种改进源于算法优势的协同效应:RF擅长处理非线性关系,SVM优化分类边界,GBM则通过迭代修正误差。模型交叉验证的置信区间(0.012-0.018)表明预测结果具有高度稳定性。

栖息地适宜性制图成果显示,Fars省5.24%的区域(3006.04 km2)被划为极高适宜区,主要分布在Marvdasht和Shiraz地区。这些区域普遍具有海拔1800-2200米、南向坡度15-25°、年均温12-16℃的生态特征。值得注意的是,模型识别出若干传统认知外的潜在高产区,如Firozabad东北部和Kazerun北部的小型适宜斑块,这些发现为扩大栽培范围提供了新思路。相反,Abadeh等低海拔干旱区则因温度胁迫和水分不足被判定为低适宜区。

该研究的创新价值体现在三个方面:方法学上创建了首个以代谢物含量为导向(而非单纯物种分布)的栖息地评估框架;技术上实现了卫星遥感数据与地面理化分析的深度融合;应用层面则开发出可推广的"环境-代谢"预测模型。这些突破不仅为N. persica的精准栽培提供决策支持,其技术路线还可拓展至其他高价值药用植物的资源管理。在气候变化背景下,该成果对维持干旱区生态系统服务功能、保障天然药物原料可持续供给具有战略意义,完美契合联合国可持续发展目标(SDG 15)中"陆地生物保护"的具体要求。

研究团队特别指出,未来工作将聚焦于环境因子与表观遗传调控的交互机制,并计划将该模型应用于其他次级代谢产物(如黄酮类、苯丙素类)的空间预测。这种跨尺度、多组学的整合研究范式,有望成为连接生态学与合成生物学的关键纽带。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号