RISE:一种用于营养不良分析中特征相关性的统一框架,整合了统计方法和专家见解

《Frontiers in Public Health》:RISE: a novel unified framework for feature relevance in malnutrition analytics integrating statistical and expert insights

【字体: 时间:2025年10月17日 来源:Frontiers in Public Health 3.4

编辑推荐:

  儿童急性营养不良影响因素分析及RISE框架构建。该研究通过整合统计筛选、机器学习模型与领域知识,提出RISE框架,揭示母婴身量、喂养方式及社会经济因素等关键预测因子,为精准干预提供依据。

  在全球范围内,儿童营养不良仍然是一个亟需解决的公共卫生挑战,其影响直接关系到联合国可持续发展目标(SDG 2 – 零饥饿和SDG 3 – 健康与福祉)。本研究旨在通过开发一种新型的特征评分框架——RISE(基于相关性的统计与专业知识整合),识别并优先排序影响0至23个月儿童急性营养不良的关键因素。该框架通过结合基于模型的评分(如XGBoost)、统计过滤方法以增强频率权重,以及领域知识的调整,旨在弥合数据驱动建模与情境相关洞察之间的差距。通过使用印度马图拉地区K.R.医院营养康复中心(NRC)的现实数据,RISE框架不仅提升了模型预测能力的可解释性,还增强了其在特定背景下的相关性。在调整过程中,一些具有领域意义的特征,如母亲身高、母乳喂养状况、种姓、母亲就业状况和配给卡,被证明是关键因素。此外,儿童体重、母亲人体测量数据以及儿童出生顺序在RISE框架中持续保持重要地位,反映了母亲依赖性以及营养不良的双重负担。

儿童营养不良是一个复杂的公共卫生问题,其成因涉及地域、环境、文化和社会经济等多个层面。不同地区和文化背景下,导致营养不良的因素可能各不相同,因此,进行情境敏感的分析至关重要。政策制定者在制定或修订相关政策和指南前,往往需要优先识别这些影响因素。因此,对儿童营养不良成因的研究成为关键领域。近年来,机器学习(ML)在识别营养不良决定因素方面取得了显著进展。传统的特征选择方法,如基于统计的过滤方法,被广泛用于评估特征与结果之间的统计关系,这些方法计算高效且易于解释,适用于探索性数据分析的早期阶段。然而,这些方法通常独立评估特征,忽略了变量之间的潜在交互作用,且对数据分布、规模和噪声敏感,可能忽略那些在统计上信号较弱但对实际政策或干预具有重要意义的特征。

RISE框架的提出正是为了克服这些局限性,它结合了基于模型的特征重要性、统计过滤方法和领域知识,以识别那些传统统计和机器学习模型可能忽略的主导和被忽视因素。该框架在技术上严谨,同时考虑了公共健康相关性,为营养不良相关的机器学习研究填补了关键空白。在本研究中,通过整合统计评分、频率提升和领域知识评分,RISE框架确保了所选特征不仅在预测能力上表现突出,还具有跨方法的一致性和基于专家知识的重要性。

研究使用了马图拉地区的实际数据,这些数据涵盖了儿童和母亲的人体测量信息以及社会人口特征。数据集包括206名1至23个月的儿童,其中51.5%被诊断为中度急性营养不良(MAM),48.5%为重度急性营养不良(SAM)。研究发现,尽管某些特征在统计上信号较弱,但它们在实际公共卫生和营养不良研究中仍然具有重要价值。例如,母亲身高、母乳喂养状况、种姓、母亲就业状况和配给卡等特征,虽然未被统计方法频繁识别,但在RISE框架中被赋予了较高的权重。这表明,单纯依赖数据驱动模型可能会忽略这些在实际情境中至关重要的变量。

RISE框架的设计考虑了多方面的因素,包括模型性能、方法一致性以及领域相关性。该框架的实施基于Python 3.11.11(Anaconda发行版),并采用分层K折交叉验证(k=5)来确保模型的稳健性和泛化能力。此外,使用嵌套交叉验证进行超参数调优,确保了模型在不同数据子集上的表现。通过这一方法,研究获得了最优的α、β和γ值,分别为0.1,从而实现了对模型评分、领域重要性和频率提升的加权整合。

研究还利用了SHAP(SHapley Additive Explanations)来解释模型预测结果,进一步验证了母亲人体测量数据和儿童出生顺序在急性营养不良中的重要作用。这些结果强调了母亲营养状况和家庭资源分配对儿童健康的影响。此外,研究发现,尽管某些特征如配给卡和种姓在频率提升评分中为零,但它们在领域重要性评分中仍然具有显著价值,这反映了它们在社会经济和行为维度上的重要性。

总体而言,本研究通过RISE框架展示了如何在机器学习模型中整合领域知识和统计方法,以识别那些在传统方法中可能被忽视的特征。这种方法不仅提高了模型的可解释性,还确保了关键公共卫生因素的保留和突出。通过这种方式,研究为儿童营养不良的干预措施和政策制定提供了更加科学和实用的依据,有助于实现全球营养目标,推动健康公平和可持续发展。未来的研究应进一步进行外部和时间验证,以确保框架在不同地理区域和时间背景下的适用性和可靠性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号