机器学习算法在撒哈拉以南非洲高生育率国家女性避孕知情选择预测模型中的应用研究

【字体: 时间:2025年05月30日 来源:BMC Public Health 3.5

编辑推荐:

  本研究针对撒哈拉以南非洲(SSA)高生育率国家女性避孕知情选择率低的问题,通过机器学习算法(LGBM/XGBoost等)分析11,706名育龄妇女数据,发现58%女性获得知情选择服务,其中健康机构访问、宗教背景等是十大关键预测因子。研究为优化家庭规划政策提供了数据驱动的决策依据,成果发表于《BMC Public Health》。

  

在撒哈拉以南非洲(SSA),高生育率与低避孕使用率、高意外妊娠率形成尖锐矛盾。尽管国际社会持续投入,该地区仍贡献全球过半新生儿,其中尼日尔、安哥拉等国家总和生育率(TFR)高达5.0以上。传统统计方法难以捕捉影响避孕知情选择的复杂非线性关系,而女性缺乏对避孕方法副作用管理的认知,更导致43%的避孕停用率。这一现状催生了对新型分析工具的迫切需求——如何通过数据科学破解生殖健康困局?

贡达尔大学公共卫生学院的研究团队创新性地将7种机器学习算法应用于SSA六国(布基纳法索、尼日利亚等)的人口健康调查(DHS)数据,构建了首个区域级避孕知情选择预测模型。研究发现,布基纳法索女性知情选择率最高(77%),而布隆迪最低(29%),空间聚类分析揭示了国别差异的显著性。更关键的是,通过LightGBM(LGBM)模型与SHAP(Shapley Additive Explanations)解释框架,团队首次量化了健康机构访问频率(过去12个月)、移动设备持有率等因子对决策的影响权重,为精准干预提供了"靶点地图"。

研究方法上,团队采用设计科学范式处理2015-2024年DHS横断面数据,通过SMOTE(合成少数类过采样技术)平衡数据集,运用递归特征消除(RFE)筛选变量,并采用10折交叉验证确保模型稳健性。

主要结果

  1. 人口学特征:45%受访者集中在25-34岁年龄段,62.6%报告仅有1个性伴侣,而77.7%未使用互联网凸显数字鸿沟。
  2. 模型性能:LGBM在平衡数据上表现最优(准确率73%,AUC 0.80),较逻辑回归基准提升15%,其召回率77%显示出色识别弱势群体的能力。
  3. 关键预测因子:SHAP分析揭示前三位影响因素为:近期健康机构访问(OR=1.82)、公共医疗机构避孕来源(vs私立机构)、基督教信仰背景,而手机持有通过改善信息可达性使知情选择概率提升31%。

讨论与意义
该研究突破了传统logistic回归的线性假设局限,首次证实数字健康工具(如移动平台)与实体医疗服务协同增效的可能性。值得注意的是,财富指数的影响呈现非线性特征——仅当家庭进入中产阶层后,经济因素对知情选择的促进作用才显著显现,这为扶贫政策设计提供了新思路。作者建议将机器学习预测系统整合至SSA国家的社区卫生工作站,通过实时风险评分实现精准干预。

论文同时指出局限性:未纳入医疗服务者咨询质量等微观因素。未来研究可通过自然语言处理(NLP)分析咨询录音,进一步优化预测维度。这项发表于《BMC Public Health》的成果,为联合国可持续发展目标(SDG 3.7)的监测提供了可扩展的技术框架,其方法论更可迁移至其他中低收入国家的公共卫生决策场景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号