
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习方法的尼日尔与马里农村紧急情况下五岁以下儿童急性营养不良严重程度的社会经济风险因素研究
【字体: 大 中 小 】 时间:2025年08月16日 来源:Maternal & Child Nutrition 2.6
编辑推荐:
这篇综述通过机器学习(VSURF算法)分析尼日尔和马里的1447名营养不良儿童数据,揭示了水源、照料者职业等社会经济因素与急性营养不良严重程度(SAM/MAM)的关联性。研究强调区域异质性(如尼日尔医疗距离的显著影响),并提出随机森林模型(预测准确率63%-80%)可作为优化干预策略的工具,为公共卫生决策提供数据支持。
急性营养不良仍是全球重大公共卫生问题,尤其在非洲和亚洲。本研究采用机器学习方法(VSURF算法)分析尼日尔和马里农村紧急背景下1447名6-59月龄患儿数据,构建随机森林模型(含86个变量),发现水源质量(如马里SAM患儿多饮用未保护水源)和照料者职业(如尼日尔SAM家庭多从事畜牧业)是预测严重急性营养不良(SAM)的核心因素。模型预测准确率达63%-80%,凸显社会经济变量对营养不良分级的解释力。
研究通过可视化强调区域差异:马里SAM患儿与未保护水源(家庭水龙头、雨水)显著相关,而尼日尔SAM患儿更受医疗可及性(健康中心距离>1日行程)影响。图形摘要直观呈现关键变量交互作用,为针对性干预提供依据。
机器学习可有效识别社会经济变量与营养不良严重程度的非线性关系
水源、医疗可及性和家庭经济状况是SAM升高的主要驱动因素
尼日尔与马里的差异(如医疗距离VS.水源类型)要求区域定制化政策
急性营养不良的诊断标准包括体重身高Z评分(WHZ<-2)和上臂围(MUAC<125 mm),其中SAM定义为WHZ<-3或MUAC<115 mm。既往研究多采用线性模型,忽略变量间复杂交互。本研究首次在冲突频发的萨赫勒地区(马里加奥、尼日尔迪法)应用随机森林算法,分析社会经济变量对SAM/MAM分层的贡献。
集群随机对照试验(马里)和非随机对照试验(尼日尔)纳入2020-2021年治疗的患儿,通过WHO标准划分SAM/MAM组。数据预处理剔除缺失值>5%的变量,最终分析599例(马里)和725例(尼日尔)。
VSURF算法三阶段筛选变量:
阈值阶段:按随机森林重要性排序剔除无关变量
解释阶段:选择与营养不良分级最相关的变量(尼日尔13个,马里6个)
预测阶段:通过逐步添加变量优化模型,避免冗余
采用10折5次重复交叉验证,最优超参数组合(mtry=3-7, node size=2-30)使模型准确率最大化。
尼日尔:SAM患儿家庭更可能减少餐食(44.3% VS. 34.1%)、医疗可达性差(60.8%无法当日往返健康中心)
马里:SAM患儿饮用未保护水源比例高(32.1% VS. 11.4%),照料者多从事畜牧业(OR=2.1)
模型性能:马里预测准确率(79.8%)显著高于尼日尔(68.0%),反映后者存在未测量混杂因素
MCA显示尼日尔SAM与"医疗距离>1日"(维度1坐标-1.2)强相关,马里SAM与"家庭水源"(维度2坐标+0.8)聚类明显。
研究验证了水安全(OR=1.7, 95%CI 1.2-2.4)和照料者职业(如尼日尔农业劳动OR=1.5)的核心作用。与埃塞俄比亚研究(Bitew et al. 2022)相比,本模型在冲突背景下保持63%-80%准确率,证实机器学习对复杂人道主义场景的适应性。
研究提出区域特异性干预策略:
尼日尔:通过社区健康工作者缩短医疗距离
马里:加强水源保护与职业培训
为WHO 2023年紧急指南(推荐高危地区MAM患儿使用特殊配方食品)提供本土化证据支持。
生物通微信公众号
知名企业招聘