
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习模型揭示黄河流域高氟地下水分布规律及驱动机制
【字体: 大 中 小 】 时间:2025年05月27日 来源:Groundwater for Sustainable Development 4.9
编辑推荐:
为解决黄河流域高氟地下水(F>1.5 mg/L)引发的 endemic fluorosis(地方性氟中毒)问题,中国科学院团队基于30,337组地下水样本和40项环境因子,采用随机森林(RF)算法构建预测模型(AUC=0.86),首次绘制250米分辨率风险分布图,揭示气候因子是调控氟富集的关键驱动力,估算730-890万人口面临暴露风险,为区域饮水安全防控提供科学依据。
在广袤的黄河流域,数百万居民正面临着一个"隐形杀手"的威胁——高氟地下水。长期饮用氟浓度超过1.5 mg/L的地下水会导致氟斑牙、氟骨症等不可逆的健康损害。这个问题的严重性在于,氟的富集过程涉及复杂的水文地球化学机制,传统监测方法难以全面捕捉其空间分布规律。更令人担忧的是,气候变化可能正在加剧这一环境健康危机。
中国科学院团队在《Groundwater for Sustainable Development》发表的研究,开创性地将机器学习应用于流域尺度的高氟地下水预测。研究人员收集了覆盖整个黄河流域的30,337个地下水样本,整合了包括水文地质、气候、土壤、地形和人类活动在内的40项环境因子。通过比较多种算法,最终确定随机森林(RF)模型具有最优预测性能(AUC=0.86)。研究不仅绘制了250米高分辨率风险地图,更首次系统量化了各类环境因子对氟富集的相对贡献。
关键技术方法包括:1) 采用网格搜索优化RF模型超参数(决策树数量500,最小叶节点数3);2) 基于SHAP值分析变量重要性;3) 使用30,337个样本构建训练集(70%)和测试集(30%);4) 将气候、土壤等栅格数据统一重采样至250米分辨率。
Physical geography
研究区涵盖全长5464 km的黄河流域,重点分析了河套平原、黄土高原和华北平原等典型地貌单元的水文地质特征。
Response variables
2019-2022年采集的30,337个样本显示,高氟地下水主要赋存于冲积平原浅层孔隙含水层,细粒沉积物和高黏土含量区域氟富集现象显著。
Machine learning modeling
RF模型识别气候变量为最关键预测因子,其次是土壤类型(pH>8的碱性土)和水文地质条件(滞留时间长区域)。模型成功捕捉到氟浓度与Ca2+/Na+离子交换的复杂非线性关系。
Conclusions
研究揭示:1) 高氟地下水集中分布于河套平原、黄土高原前缘及黄淮海平原南部;2) 气候差异(温差大、降水不均)是主导驱动因素;3) 估算730.7-889.9万人口暴露风险;4) 黏土矿物的pH依赖性吸附和Ca2+/Na+交换是核心地球化学过程。
讨论部分强调,这项研究突破了传统线性统计的局限,首次在流域尺度阐明气候-地质-人类活动的协同作用机制。提出的"气候驱动-地质控制-人为影响"三元概念模型,为全球类似地区的水质预测提供了范式。特别是250米高精度风险图的绘制,可直接指导农村改水工程选址,对实现联合国可持续发展目标(SDG 6)具有重要实践价值。研究团队建议将机器学习监测网络纳入国家饮水安全预警体系,这对应对气候变化下的环境健康挑战具有前瞻性意义。
生物通微信公众号
知名企业招聘